由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 如何用Python或者Perl抓取文本?
相关主题
最高大上的 atoi竟然有人鼓吹自动生成代码的?
perl的文本处理大部分容易在python里实现吗?any perl html parser to recommend?
谁知道如何调试yacc程序?[合集] 被perl雷到了,sed, awk, cygwin, native以及其他
yacc/bison的调试和分析工具?newbie python question
any lexer/parser enthusiasts here?为什么一说文本处理就提perl
用什么编程语言来解析围棋的 sgf 文件?script language主要是干什么用的?
请教一个parser的问题请教一个初级问题
怎样才能用perl等东西知道c macro中的数值请教,网页抓取、内容整理提取用什么做比较简单
相关话题的讨论汇总
话题: 数值话题: 文本话题: lines话题: perl话题: python
进入Programming版参与讨论
1 (共1页)
p*****n
发帖数: 143
1
我有一个文件,想把里面的数值文本抓出来,每隔四行有一行数值:
26519 122.0663
30873 140.0737
d)=.014

Obs Mean
r*******n
发帖数: 3020
2
输出所以以数值开头的行到新文件
没有测试。
如果文件不大
# Read data
f = open('your file', 'r')
lines = f.readlines()
f.close()
result = []
for each_line in lines:
item1, item2 = each_line.split()
if item1.isdigit(): # Assume in item1 there is
no dot
result.append(each_line)
# Write data
f = open('your new file', 'w')
f.write(''.join(result))
f.close()

【在 p*****n 的大作中提到】
: 我有一个文件,想把里面的数值文本抓出来,每隔四行有一行数值:
: 26519 122.0663
: 30873 140.0737
: d)=.014
:
: Obs Mean

b******n
发帖数: 592
3
if it is every 4th lines,
awk 'NR%4==0{print $0;}' input.txt
will do

【在 p*****n 的大作中提到】
: 我有一个文件,想把里面的数值文本抓出来,每隔四行有一行数值:
: 26519 122.0663
: 30873 140.0737
: d)=.014
:
: Obs Mean

O*******d
发帖数: 20343
4
我以前用过lex/yacc做parser抓数据。 给yacc写grammar太麻烦了。
1 (共1页)
进入Programming版参与讨论
相关主题
请教,网页抓取、内容整理提取用什么做比较简单any lexer/parser enthusiasts here?
问题:如何打开搜索二进制文件 (转载)用什么编程语言来解析围棋的 sgf 文件?
perl 问题求教请教一个parser的问题
请教个python抓网页的问题怎样才能用perl等东西知道c macro中的数值
最高大上的 atoi竟然有人鼓吹自动生成代码的?
perl的文本处理大部分容易在python里实现吗?any perl html parser to recommend?
谁知道如何调试yacc程序?[合集] 被perl雷到了,sed, awk, cygwin, native以及其他
yacc/bison的调试和分析工具?newbie python question
相关话题的讨论汇总
话题: 数值话题: 文本话题: lines话题: perl话题: python