找回密码
 开放注册
搜索
查看: 476|回复: 7

【文科生!终于可以被消灭了...】

[复制链接]
发表于 2012-11-21 14:24:20 | 显示全部楼层 |阅读模式
 楼主| 发表于 2012-11-21 14:38:29 | 显示全部楼层
因为19大家都有,所以去掉,
那么我的生日就可以作一句:千里江南人肠断
果然好诗
发表于 2012-11-21 17:46:12 | 显示全部楼层
挺有意思的,数据挖掘就是能揭示大量信息的内在性质和规律。

中文分词可用IKAnalyzer。开源,可以整合到Java中调用。

统计词频的算法叫做N-gram,本来是用来预测一句话中下一个词出现的概率。一般来说,先分词再用N-gram比较好。作者提到的主要应用了uni-gram, bi-gram 和tri-gram算法,也就是统计1个/两个/三个字(词)的频率。
发表于 2012-11-21 23:58:27 | 显示全部楼层
乐谱也是有规律,可是能做出绝世好乐的还是人类
发表于 2012-11-22 00:14:39 | 显示全部楼层
过去那个法国达达派,就是这么制作诗歌的。
发表于 2012-11-23 21:15:26 | 显示全部楼层
引用第3楼i火花于2012-11-21 23:58发表的  :
乐谱也是有规律,可是能做出绝世好乐的还是人类
有理,早就有软件能作曲了,可没有能拿得上台的,徒具其形罢了。
发表于 2012-11-23 23:35:26 | 显示全部楼层
哼,没有《全宋词》哪里来的上述数据。让电脑作诗和让猴子敲出莎士比亚一样,宇宙死了都不一定能弄出来。
发表于 2012-11-24 12:31:52 | 显示全部楼层
数学5的渣渣表示根本没看懂
您需要登录后才可以回帖 登录 | 开放注册

本版积分规则

Archiver|手机版|小黑屋|13号避难所-旧人类论坛

GMT+8, 2026-6-16 14:20 , Processed in 0.410031 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表