从大量文本中提取整数的Java正则表达式
【腾讯云】亏本大甩卖,服务器4核16G 1年370元(带宽12M,系统盘120GB SSD盘,月流量2000GB)!!!!!!
云产品 配置 价格
服务器 1核2G,带宽5M,系统盘50GB SSD盘,月流量500GB 38元/年
MySQL 1核1G 19元/年
服务器 16核32G,带宽18M,系统盘250GB SSD盘,月流量5000GB 1197元/年
点我进入腾讯云,查看更多详情

I need to extract a value from a large body of text. I'm assuming the best way to do this would be to use a regular expression. If anyone thinks there's a better way to do it, feel free to offer up a suggestion.

The value I need to extract always appears in a string of the form:

[formatted_int_value] results across [the_integer_value_I_need_to_extract] pages

e.g: 3,342 results across 67 pages

In the example above the value I'm trying to extract is 67. Also note that each word in the example above may be separated by one or more whitespaces and/or newline characters. And, as mentioned above, this text is part of a larger body of text (I'm screen scraping a web page).

Can someone help me with a regex to extract the int value I need (67 in my example above) that takes into consideration the conditions I've provided?

Thanks.

#0

The regex would be quite straight-forward:

([\d,]+)\s+results\s+across\s+(\d+)\s+pages

The 67 would be in group 2, the other number (if you need it) in group 1.

var text = "some text here 3,342 results across 67 pages some more text here";
var regex = /([\d,]+)\s+results\s+across\s+(\d+)\s+pages/;

var matches = regex.exec(text);

/* matches will be this array:

["3,342 results across 67 pages", "3,342", "67"]
---- entire match --------------  --g1---  -g2-    
*/

#1

int theIntYouWantToExtract = Integer.parseInt(yourLongText.replaceAll(
        ".*([\d,]+) results across ([\d,]+) pages.*",
        "$2"));

推荐文章

如何使用Html.GetUnobtrusiveValidationAttributes()

如何使用Html.GetUnobtrusiveValidationAttributes()

推荐文章

在MapView上平移和缩放

在MapView上平移和缩放

推荐文章

这个语法叫什么?`新类型(){。。。}`

这个语法叫什么?`新类型(){。。。}`

推荐文章

如何从USB数码相机(RAW)绘制图像?

如何从USB数码相机(RAW)绘制图像?

推荐文章

由于未捕获异常而终止应用程序“NSRangeException”给出的范围或索引超出界限'

由于未捕获异常而终止应用程序“NSRangeException”给出的范围或索引超出界限'

推荐文章

如何在linux下使用c时打印函数的运行时间?

如何在linux下使用c时打印函数的运行时间?

推荐文章

安装应用程序时需要触发器

安装应用程序时需要触发器

推荐文章

如何从窗体(而不是文档)启动Word VBA应用程序?

如何从窗体(而不是文档)启动Word VBA应用程序?

推荐文章

是否可以自动将mysql数据库备份到dropbox?

是否可以自动将mysql数据库备份到dropbox?

推荐文章

FluentNHibernate或端口到NHibernate的代码映射

FluentNHibernate或端口到NHibernate的代码映射

推荐文章

IF-EXIST子句

IF-EXIST子句

推荐文章

Rails有多个:through和collection\u select with multiple

Rails有多个:through和collection\u select with multiple

推荐文章

浮点值的舍入

浮点值的舍入

推荐文章

线程-一个线程数组,其中每个线程包含一个带有图像的窗体

线程-一个线程数组,其中每个线程包含一个带有图像的窗体

推荐文章

“确定”按钮未显示在中外部消息警报

“确定”按钮未显示在中外部消息警报

推荐文章

正则表达式:不是行的开头吗?

正则表达式:不是行的开头吗?