第一百四十九章 TT智译,科技衍生全文阅读

　　凡语要想彻底颠覆社交领域，做facebook、twitter的终结者，仅凭当下的完美翻译远远不够。

　　还需要更进一步，拥有更多的卖点！

　　当下社交软件的交互，不仅局限于传统的文字，更是包含视频、语音等等。

　　更重要的是，互相之间的综合交互，例如语音和文字之间的转译。

　　因此，凡人论坛或者凡语，要颠覆整个领域，逃不过与时俱进。

　　视频交互容易解决，没多少难度，然而语音就不同了。

　　尽管当下智能语音输入软件颇多，但精准度以及模糊识别一直是个大问题。

　　当用户对着语音输入法，兴奋地说了一堆话，结果识别错误颇多，掉字连连,甚至连语义都扭曲了。

　　至于那些不标准的普通话，以及方言，结果更是惨不忍睹。

　　说是鸡肋都不为过。

　　更何况王凡要求的更高！

　　他想要将一种语言的语音，翻译成另一种语言的语音。

　　完美实现不同语言之间的对话交互，而不是单纯地局限在文字上的完美交互。

　　例如英语和华夏语的对话交互。

　　这需要将英语的语音，转为英文。然后完美翻译成华夏文，再度读出来，变成华夏语，从而传递给另一个人。

　　反义亦然。

　　整个过程要确保准确无误，尤其是第一个过程，语音到文字，一旦出现错误，后面整个过程都会出现问题。

　　而两种文字的完美翻译，当下已经实现，至于最后的文字到语音的阅读，那更不是问题。

　　只是如此精准地将语音识别，这种近似“智能”的过程，王凡凭自己的力量当然搞不定。

　　即便当下全球领先的巨头，依旧局限在“模糊识别”的不精确阶段。

　　不过通过科技衍生系统，一切都将与之不同。

　　王凡亲自挑选了一些语音识别软件，讯飞、千度、灵犀、云之声、googlenow、siri以及微软cortana。

　　一番比较，各有千秋。

　　讯飞、千度、灵犀等，比较适合华夏，但对国际方面的处理不太给力。

　　而googlenow、siri以及微软cortana，则擅长国际，很多华夏方面的做不到位。

　　一番权衡，王凡最终选择了googlenow，这款综合性比较优越的语音识别软件。

　　在此基础上，王凡衍生出一款新的语音识别软件——tt智语。

　　一番测试，这款语音识别软件的强大让王凡赞不绝口。

　　不仅能智能识别华夏语、英语、俄语、法语等常用语言，还能识别俚语。

　　即便王凡对着tt智语爆粗口，都能智能识别或模糊转译。

　　之所以有些模糊转译，是因为很多方言或者粗口，太过“高端”，当下还没有具体的汉字与之对应，连我们都写不出。

　　不过很快王凡发现了问题，对于普通话或者近乎普通话，智能识别准确率几乎百分百。

　　但对于方言音频的识别，有些差强人意，准确率只有百分之九十左右。

　　尽管这一比例已经很高，足够用户使用。但作为系统出品的黑科技，还是有些不够看。

　　另外，对于方言音频的识别，会出现两个版本。

　　例如智能识别《咱们屯里人》时候，出现了两个结果。

　　一个是标准的普通话版，一个是直接识别的版本：偶滴老嘎，就组在则个屯。偶系则个屯里，土生土长滴羊……

　　而且联网状态时，普通话版本处于优先等级。断网状态，直接识别版本处于优先等级。

　　但当王凡选择直接识别版本后，结果无论联不联网，都是直接识别版本处于优先等级。

　　之后王凡又试验了一些其他的方言音频，同样如此。

　　只是随着不断他的尝试，和选择，tt智语识别变地愈加准确，方言正确比率已经提升到97%！

　　而且版本选择都是直接识别版本！

　　王凡忍不住感叹，tt智语识别不仅识别能力强，更能不断完善、进步。

　　通过记录、分析用户的习惯，被动扩充方自己的言语音库，使得识别结果更符合使用者的要求，方言识别准确率也逐步提升。

　　例如王凡选定直接识别版本，其他的方言音频也都会优先呈现直接识别版本。

　　而对于方言的识别精度，也从90%增加到97%。

　　为了验证自己的猜想，王凡又找了些方言音频让tt智语测试。

　　对于不对的地方或者模糊的地方，他同样进行纠正或做出偏好选择。

　　随着时间的推移，

　　97.5%，97.9%，98.2%，98.4%，98.5%……

　　方言识别准确率不断提升，只是提升的幅度，明显越来越小。

　　最后过了两个小时，依旧没有从98.7增加到98.8。

　　尽管98.7%这一数据已经比较令人满意，只是之后的增幅实在是小的可怜。

　　无奈之下，王凡只能暂时放弃。

　　略微休息，王凡开始思考，语言智能识别软件有了，完美翻译软件也有了，只剩下语音朗读软件。

　　这种软件技术含量很低，应用市场上一大片。

　　王凡找了几个，却不太满意。

　　要么是冷冰冰的机器语言，要么是有限的几个明星的声音，例如郭老师、志玲姐，还有机器猫……

　　于是王凡再度衍生了一个同声朗读软件。

　　这个同声，是指朗读时，完美模拟之前录入的声音。甚至连语气、语速都模拟的惟妙惟肖。

　　例如，刘德华唱屯里人，最后再完美模拟刘德华的声音，进一步朗读出来。

　　最终王凡又将tt智能语音识别、完美翻译、同声朗读，三者合一，成为一个新的软件——tt智译。

　　tt智译，可以完美地将一种语言的声音，转译成另一种语言的声音。

　　整个过程，说话人的语义、语气、语速、语音都近乎丝毫不差。

　　更过分的是，反应速度惊人，整个过程基本实现秒译！

　　王凡选定希伯来语输出，接着对tt智译说了声：新年快乐，猴年大吉！

　　tt智译立即模仿者王凡的声音、语气，用希伯来语回道：猴年大吉。

　　这让他有种恍惚的感觉，似乎一下子精通了希伯来语。

　　王凡疲惫地抬起头，窗外夜色正浓，时间已经到了深夜……

　　————

　　ps：新年快乐，猴年大吉！三更拜年。（第一更！）

　　感谢爱上撒旦12、大三木、企鹅的哥哥、greenc、小说很小、账号密码表、房价很会、仁心无天、杰杰together、糖水他哥、北极的天龙、宇宙f、漂扬的风等人的打赏。以及紫藤树花、辉星、我爱水分等人的推荐支持。谢谢。

　　春节期间不仅正常更新，还加更，连春晚都没看，一直码字，求推荐票安慰……

科技衍生作者：前朝的孤

第一百四十九章 TT智译

科技衍生
作者：前朝的孤