分词实验

风暴红QxRed 发表于 2007-12-18 13:02:16

今天用CRF++ 0.49做了sighan bake off 4的部分实验(待补充),实验结果如下
template:

U00:%x[-1,0]
U01:%x[0,0]
U02:%x[1,0]
U03:%x[-1,0]/%x[0,0]
U04:%x[0,0]/%x[1,0]
U05:%x[-1,0]/%x[1,0]
B

用B B2 B3 M E S 6 tagging 方法,命令行
crf_learn -c 100 template train model
测试工具用sighan bakeoff 2的工具
测试结果
ctb: F-value  0.95
ncc: F-value 0.9329

收藏: QQ书签 del.icio.us 订阅: Google 抓虾

最新评论


  • arealme
    2007-12-18 15:01:46 匿名 144.214.*.* http://cwseg.spaces.live.com

    这个结果是正常的.可能我最开始的结果不正常吧.具体看我的blog的回复.不过如果以微软报告的结果为准的话, pocket crf的结果依然和crf++之间存在差异,0.2-0.3的f-score差距不能算小了.


  • arealme
    2007-12-18 15:03:51 匿名 144.214.*.* http://cwseg.spaces.live.com

    另外我用的版本是crf++0.44,我不知道这是不是原因。


  • qxred
    2007-12-18 15:23:43 匿名 24.7.*.*

    谢谢!
    pocket crf也许有bug,我再看看:)

发表评论

* 昵称

已经注册过? 请登录

新用户请先注册 以便能显示头像及追踪评论回复

Email
网址
* 评论
表情
 
 

分类小组论坛
杂谈, 娱乐、八卦, 文学、艺术, 体育, 旅游、同城, 象牙塔, 情感, 时尚、生活, 星座, 科技

请注意遵守中华人民共和国法律法规, 如威胁到本站生存, 将依法向有关部门报告, 同时本站的相关记录可能成为对您不利的证据.

相关法律法规
全国人大常委会关于维护互联网安全的决定
中华人民共和国计算机信息系统安全保护条例
中华人民共和国计算机信息网络国际联网管理暂行规定
计算机信息网络国际联网安全保护管理办法
计算机信息系统国际联网保密管理规定