第十六章 侃价狂魔

    第十六章 侃价狂魔 (第2/3页)

   最后一点,则是我们原本缺乏对不同类型用户提供定制化细胞词库的服务,比如有两个用户,他们同样打hui-u这样的拼音,第一个用户是个秘书,他可能希望打出‘会晤’这个词;而第二个用户是写散文的,或许他就希望打出‘悔悟’这个词。要知道即使是最大样本的词频统计,也只是对最接近大众的用户最优化,而非对每一个用户定制化地最优化。只有加入了细胞词库,让输入法在服务文秘用户的时候给一种词频,给普通用户的时候另一种词频,二笔用户的时候第三种词频,才能精确抓住所有人。”

    初音娘blabla说了一大堆,顾莫杰越听越是惊喜。

    其实如果不是他对后世的记忆已经被洗得七七八八的话,说不定此刻他就会惊讶万分:这不就是2006~07年左右才上市的“搜狗拼音输入法”才做到的功能么?当然了,07年左右的搜狗,也只做到前两点改进而已,至于定制化设计和细胞词库这些功能,后世的搜狗其实都是到了08~09年光景才慢慢发展出来的。

    随后,顾莫杰又冒出了一个新的问题:“那为什么半年之前我们做不到这些功能点?当时是因为什么障碍,导致没法一步到位的?”

    “当时咱刚刚到这个时空,人家又没有2050年的云端数据库可以调用,当然没法一步到位。如今好歹通过软件商那个搜集用户习惯数据的后门,花了这半年,勉强搜集够了所需的大数据,有了素材基础,才能解锁这些新功能点的。”

    顾莫杰一听确实是这个道理,没有继续追问下去。

    不过初音娘却没有说完,顿了一顿,似乎觉得顾莫杰已经入彀,才狡黠地补充道:“还得提醒你一点,如果你真的准备按照刚才所说的三个技术要点升级的话,你可得多弄一些服务器资源了。现在这些

    (本章未完,请点击下一页继续阅读)