您的位置:首页> 科技> 记者观察:人工智能也能听懂方言

记者观察:人工智能也能听懂方言

来源:中国银行保险报时间:2023-11-07 08:00

□记者 苏洁

人工智能还能识别方言?资料显示,世界上一共有7000多种语言,但是,我们懂的可能就只有几种或者几十种,而目前的计算机语音识别技术所能覆盖的就有100多种。

“方言应用的窗口期大约是二三十年,AI识别方言实际困难很大,所以很少有人愿意推动做这件事。尽管我们金融业务带来的客服语音积累了方言语料,但从大量语音中提取方言数据又是另一个挑战,从1万小时的语音数据中找出100小时的方言犹如大海捞针。”信也科技算法科学家倪博溢坦言,各地方言常以口语形式流传,缺乏对应文字,并且难以收集,可用于模型训练的方言语料数据偏少。

早在去年11月,谷歌宣布推出“1000种语言计划”,旨在构建一个机器学习(ML)模型。然而,其中一些语言的使用人数不到2000万,因此核心挑战是如何支持使用人数相对较少或可用数据有限的语言。今年5月,Meta推出了大规模多语言语音(MMS)模型,可以识别4000多种口头语言,同时还扩展了文本与语音之间的转化技术的涵盖范围,从大约100种语言扩展到1100多种。

在国内,抖音上线了地方方言自动翻译功能,“一键”可将粤语、闽语、吴语、西南官话、中原官话等方言视频转化出普通话字幕。科大讯飞申请的“多方言识别方法、装置、设备及可读存储介质”专利获授权,可通过预先构建的方言识别模型进行方言的识别,用户不必再进行语音识别模式的切换,简化操作,提高多方言识别的准确率和效率。

得益于科技的快速发展,在金融领域,方言的识别技术能够在提升金融业务质效方面发挥积极作用。比如,马上消费金融打造了自主研发的语音识别模型,不仅能够有效地解决上述难题,还在识别准确率上得到大幅提升。据了解,该模型已经在马上消费金融的智能外呼、智能客服、电话录音质检等多个业务场景落地。近期,水滴保险经纪上线“AI语音理赔解读功能”,依托水滴大数据和AI能力,覆盖疾病知识库、健康告知库、疾病风险等级库、药品库等十大知识库,数据总量超过4100万条,能够实现与客户理赔数据的快速关联比对,并出具是否符合理赔标准的初步判断。

听懂方言仅仅是人工智能技术擅长的一个点,随着新技术的迭代和升级,人工智能可以做的事情还很多。

近日,研究机构Gartner发布了2024年十大战略技术趋势,共同主题是人工智能。Gartner预测,到2026年,超过80%的企业将使用生成式人工智能的API(应用程序编程接口)或模型,或在生产环境中部署支持生成式人工智能的应用,而在2023年初这一比例不到5%。

在金融领域,人工智能带来了无限想象空间。萨摩耶云科技集团创始人、董事长兼CEO林建明在近期举办的公开活动中指出,未来2-3年,比较成熟的AIGC产品将广泛应用于金融客服、风控等领域。金融科技企业借助AIGC技术优势,可为金融业提供更智能化、自动化的服务与方案,进一步加速产业变革创新。未来的大模型,可能会装在我们的手机上,让用户与银行中后台的大模型进行连接交互,实现快速、便捷使用。

人工智能变革浪潮已来。行业人士认为,未来十年是真正的通用人工智能的十年,到那时,算法、算力、应用都将被重塑,也将为整个生产力带来极大提升。