上海热线 www.online.sh.cn

科技

分享

交大高精度语料库 让翻译精准度有望趋近100%

上海热线 2018-01-17 09:48:21

    你知道吗?语料库研究与人工智能语音技术“结对”,1亿字符高精度语料库或将让翻译精准度有无限趋近100%的可能;而语言、AI技术与病理专业领域多维度融合,还能创新语言智能与语言病理研究。

    近日,由上海交通大学外国语学院院长胡开宝教授领衔申报的"中国特色大国外交的话语构建、翻译与传播研究"项目获2017年度国家社会科学基金重大项目立项。1月16日下午,该重大课题举行开题报告会,来自外交部、外文局和国内高校的外交学、语言学、翻译学和传播学领域的专家学者齐聚一堂,深入探讨如何构建、翻译与传播融通中外的中国特色大国外交的话语。

一亿字符高精度语料库 让翻译精准度有无限趋近100%的可能

近年来,随着网络技术发展,各种翻译软件应接不暇,翻译软件在翻译速度和效率上的优势给人们带来很多便利。然而,由于翻译软件的程序是固定的,机器翻译往往会存在翻译准确度低、长段落结构逻辑性不强、可读性较差等缺点。人工翻译则能避免这些问题,通过分析句子结构和上下文逻辑关系并进行翻译。但是,一个人的精力往往有限,人工翻译相较机器翻译更加费时费力。

如何能够尽可能把人工翻译的优点“移植”到机器翻译中?上海交大外国语学院深耕平行语料库的理论和实践研究,建立系列语料库,形成总量达1亿字符高精度语料库,有效提升机器翻译产品的准确度,极大缓解后期人工校正工作量,令机器翻译精准度有了无限趋近100%的可能性。

据了解,上海交通大学拥有全国第一个学习者语料库、科技英语语料库和口译语料库;目前已经建成和在建的语料库多达16个,包括4000万字词的英汉文学平行语料库、7000万字词的英汉双语双向平行语料库以及航空科技英语语料库、医学英语语料库等专用语料库,语料库相关专利与著作权共有4项。

语音语料与人工智能技术“结对”

“语音语料”还能将汽车变成“友好互动”的“小伙伴”。当您驾驶车辆行驶在路上,只需说出简单词句,通过车载人机交互系统的智能语音识别功能,便可轻松控制导航,进行语音通话、娱乐系统等各项功能操作。这一目标的实现,离不开语音语料与人工智能技术的交叉研究。

上海交大外国语学院依托语言认知基地言语-语言-听力中心,建立语言认知实验室,从事语音识别、语音合成、机器翻译及言语障碍的诊断和修复等多维度研究,以人类语言特征的分析为基础提供深入学习语音理论和研究探索的平台,并与业界主流语言智能公司合作,借助言语智能研究收集不同人的声音发音,标注语音特征,再进行深度学习训练,形成语音识别产品,人文学科研究成果与科技产业界的结合,让语音识别有望从“听到”变得“听懂”。

声明:本网站所提供的信息仅供参考之用,并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑,请尽快与上海热线联系,本网将迅速给您回应并做相关处理。联系方式:shzixun@online.sh.cn
©1996-2017 上海热线信息网络有限公司版权所有