悉尼科技大学(UTS)GrapheneX UTS以人为中心的人工智能中心的研究人员开发了一种便携式、非侵入性的系统,可以解码无声的想法并将其转化为文本,这在世界上尚属首次
这项技术可以帮助那些因疾病或受伤(包括中风或瘫痪)而无法说话的人进行沟通。它还可以实现人与机器之间的无缝通信,例如仿生手臂或机器人的操作
2023年12月12日在新奥尔良举行的NeurIPS年会展示了世界领先的人工智能和机器学习研究,该研究被选为该年会的焦点论文
这项研究由GrapheneX UTS HAI中心主任CT Lin特聘教授、第一作者段益群和UTS工程与IT学院的博士候选人周金洲领导。
在这项研究中,参与者戴着一顶帽子,通过脑电图(EEG)记录他们头皮上的脑电活动,一边默读课文
脑电波被分割成不同的单元,从人脑中捕捉特定的特征和模式。这是由研究人员开发的一个名为DeWave的人工智能模型完成的。DeWave通过从大量的脑电图数据中学习,将脑电图信号翻译成单词和句子
以前将大脑信号转换为语言的技术要么需要在大脑中植入电极的手术,如埃隆·马斯克的Neuralink,要么需要在MRI机器中进行扫描,这是一种大型、昂贵且难以在日常生活中使用的技术
这些方法也很难在没有额外帮助(如眼动追踪)的情况下将大脑信号转换为单词级片段,这限制了这些系统的实际应用。这项新技术既可以使用眼动追踪,也可以不使用眼动追踪
UTS研究共有29名参与者。这意味着它可能比以前只在一两个人身上测试过的解码技术更强大、更具适应性,因为脑电波在个人之间不同
使用通过帽而不是从植入大脑的电极接收的脑电图信号意味着信号更嘈杂。然而,在脑电图翻译方面,该研究报告了最先进的表现,超过了之前的基准
段说:“这个模型更善于匹配动词而不是名词。然而,当涉及到名词时,我们看到了一种倾向,即同义词对而不是精确翻译,比如‘男人’而不是‘作者’。”
“我们认为这是因为当大脑处理这些单词时,语义相似的单词可能会产生相似的脑电波模式。尽管存在挑战,我们的模型还是产生了有意义的结果,对齐了关键词,形成了相似的句子结构,”他说
BLEU-1的翻译准确率目前约为40%。BLEU分数是一个介于0和1之间的数字,用于衡量机器翻译文本与一组高质量参考翻译的相似性。研究人员希望这一水平能提高到与传统语言翻译或语音识别程序相当的水平,接近90%
这项研究是在UTS与澳大利亚国防军联合开发的脑机接口技术的基础上进行的,该技术使用脑电波来指挥四足机器人。