0
Google 黑板报:谷歌热榜推出月度热词功能
我一直对谷歌热榜不以为然,觉得是没技术含量的东西。后来宝贝做毕业论文,我才发现其中还是有很多值得研究的地方。
Google 是做搜索引擎的,语料资源当然不是问题。我对流行语的提取感兴趣的是:
- 如何将相似关键词归类?比如五月热词有陈晓旭,但是郝彤这个关键词是如何归在一起的,这个是手工筛选出来的吗?
- 被审查的关键词怎么办?
- 能否将一种特定句式的流行语筛选出来,而不是一个简单的固定词汇。比如"你才是xx,你们全家都是xx" 貌似挺流行,能不能把这个句式提取出来呢?
目前的月度热榜还比较粗糙,总共的挑出来的就那么几个,对于关键词的评论比较好。不过这个榜单反应速度有点慢,不妨实时生成,月末截止。类似现在已有的上升最快的词语。当然有可能会出现上面我提出的第二个问题。
发表评论