最近好烦

风暴红QxRed 发表于 2008-02-19 07:06:58

看编译原理看得累死了,进入左递归了!不知道怎么搞的,计划里没有这一项的。本来下半年继续看Convex的,现在还没动。烦死了,真想放弃编译原理。

收藏: QQ书签 del.icio.us 订阅: Google 抓虾

最新评论 浏览全部的15条评论 »


  • wshxzt
    2008-02-20 10:32:43 匿名 220.112.*.*

    学过啊……但是考试考得很简单啊@@

    现在似乎确实有很多人在做统计和逻辑结合的方法……好象afliboy实验室就有人做


  • nzinfo
    2008-02-20 11:15:32 匿名 125.33.*.*

    嗯,你可以通过将脚本加入C代码中完成类似的功能吧?实验室的东东不用太苛求效率的。
    例如Python和Lua都是好选择。
    不过Lua不支持UTF-8,记不清了。
    Python是没问题的。在后处理,写一堆Python 脚本, Coool


  • qxred
    2008-02-20 14:23:48 匿名 24.7.*.*

    我也觉得逻辑和统计结合是比较合适的方法。统计有一个弱点,就是它受到特征表示的约束。复杂的特征很难融入到统计方法中。比如在NE识别中,用顿号隔开的串都代表同一个NE,(北京、上海、天津、重庆是直辖市。)这样的特征在结构化机器学习中是很难用的,其计算代价太大。另一方面,这样的特征实际上冲突是很少的,因为一般来说,串的长度越长,其确定性就越大。比如分词中,“的”究竟是"B"还是"I"还是"O"很难确定,但是"的确"就中的"的"就很可能是"B"了,而"计划的确定"中的"的"几乎100%是"O"了。正因为冲突少,而且又难被机器学习的方法利用,所以我觉得规则的方法在这点上是有前途的。
    个人观点,:)


  • qxred
    2008-02-20 14:28:40 匿名 24.7.*.*

    我也想过用一些正则表达式等工具简单处理,可是我想还是来得彻底一点吧,有一个统一的平台比较好,这样以后代码维护也比较方便,只需要修改语法的配置文件,而不需要修改代码了。


  • nzinfo
    2008-02-20 14:43:12 匿名 125.33.*.*

    这和我的意思一样。换个思路,不自己读取配置文件,交给python解释器。也就是,将Python解释器作为配置文件读取模块嵌入自己的程序中。这样可以绕过讨厌的Lex&Yacc过程,而Python的文法本身是完备的。
    而后,C代码中需要配置文件进行判断的地方,调用预定义好的Python过程就ok了。
    Python不是GPL的,嵌入商用程序没问题。不会带来法律上的隐患。
    ps: Python自带正则表达式模块,支持中文

  • 2008-02-20 15:09:42

    谢谢您的推荐,只是我有3个问题不是很清楚:
    0) 你技术很好,我想perl,lisp等等大概你都用过,为什么你单单推荐python呢?
    1) LR(1)文法属于2型文法(CFG),正则表达式是3型文法,在表达能力方面前者强于后者。不知道Python能不能提供CFG,有的话就太好了。
    2) python是解释执行的么?python的执行速度和内存占用如何呢?


  • nzinfo
    2008-02-20 15:59:59 匿名 125.33.*.*

    1、因为Python支持中文最好,Perl和Lisp相对差一些(比较年代久远了)。
    而Python内置有UTF-8支持(in fact unicode),内置Re支持,而且Python在语法上也更接近Basic,想想整天面对$, (),会疯掉的。呵呵
    2、因为Python作为配置文件读取模块的软件我做过,里面有什么坑基本都知道,你有问题我可以随时帮你搞定。
    3、Python是全功能的解释语言,可以实现CFG
    http://www.canonware.com/Parsing/
    4、Python是解释执行的。执行速度相对较慢和php差不多,内存我没看过。
    不过,就NLP应用而言,如果不实际做商用程序,速度和内存占用都不用考虑。毕竟能跑CRF的机器跑Python很容易。而且,就算是要商用通过Python发现新规则后,可以用C在实现之。
    迅速的实现系统,发现数据之间潜在的关系,迅速的发paper才是王道。呵呵


  • qxred
    2008-02-21 12:26:04 匿名 24.7.*.*

    太谢谢了!那我开发工具时试试看,呵呵。Python读/paisen/是吧


  • qxred
    2008-02-21 13:14:51 匿名 24.7.*.*

    可否推荐一些适合初学者的资料呢?


  • nzinfo
    2008-02-21 13:35:29 匿名 125.33.*.*

    参考的URL以发我Blog,请移步过去。:-)
    Python读什么我也不清楚,反正就是这个东西就是了。和老外交流错几次就知道正确的读音了。Linux现在还有不少不同读法呢。

发表评论

* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 
 

分类小组论坛
杂谈, 娱乐、八卦, 文学、艺术, 体育, 旅游、同城, 象牙塔, 情感, 时尚、生活, 星座, 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定