No problem.(没问题。)

日记列表


  • 天气
  • 2007年06月15日 03:28 星期五

支持正则表达式的编辑器:SED

今天有一个朋友让我帮他写一个正则表达式,来把网站日志中带有php的行挑出来。

原以为是在php或js下实现,我满口答应,可他说不是,是在ultraeditor下做这事情表情。额的神哪,ultraeditor的正则表达式是公认的烂,用它的正则怎么可能找到东西?又问了一下,嗯,他那还有editplus,好吧,ep支持的正则比ue好多了,我研究研究去。

几分钟下来,我发现我错了……把日志中带有php的行找到没问题,问题是如何挑出来?好吧,换个思路,如何找到不含有php的行?我把ep的帮助文件翻来覆去的看,关于正则,总共就短短的几段话,里面关于反向的部分一句没有。那我该怎么办?

没办法,上网去找找有没什么对正则支持比较优秀的编辑器,搜索了一下,一大把都是正则的验证器,没看到什么能够吸引住我眼球的东西。等等,那是什么?sed外链?stream editor?流编辑器?

在阅读完这位老兄(地址见上)的文章之后,我知道,sed就是我所需要的工具,于是,下载sed外链,看sed中文文档外链,研究语法,最终似乎还是帮他把问题解决。

对于sed我不加具体描述了,看上面提到的那篇blog就可以了解个大概了,再加上sourceforge上sed外链的相关信息非常全面,包括下载、文档、实例、游戏(用文本编辑器写游戏,你听说过吗?),应有尽有,足够了解这个编辑器的了。


2007-6-27 0:21补充,郁闷地发现,ssed似乎对非utf-8的中文支持有点问题,不知道是不是我的命令有问题,我在给超过20字节的行首加入中文全角空格时,输出的文件居然是乱码,而在utf-8下,虽然不会乱码,但是却没加入应有的中文空格,英文空格倒是可以-。-

昵称*:

邮箱 :

主页 :

  • :)
  • :o
  • :D
  • ;)
  • :p
  • :mad:
  • :confused:
  • :(
  • :rolleyes:
  • :cool:
  • :eek: