发布信息

苹果与多国高校及研究院联合发布:大语言模型英语思维定式问题揭秘

作者:软荐小编      2025-05-18 14:01:21     66

5月17日,IT之家报道,苹果公司携手多国的高等学府和研究机构共同揭晓了他们的最新研究成果,指出了大语言模型中普遍存在的“英语思维定式”现象,并提出了相应的创新性解决方案。值得关注的是,参与研究的团队中,中国学者的身影亦颇为亮眼。

苹果英语说话__苹果的英语口语

研究人员对非英语语种在输出过程中普遍出现的语法及词汇错误进行了深入分析,测试范围包括中文、法语以及基于维基百科的英语语料。

测试结果显示,即便针对中文进行了特别优化的Qwen模型,其母语能力依旧不及人类;在综合表现方面,meta的Llama 3.1模型表现最为出色,然而在自然度上仍有较大差距;所有模型在非英语语言输出时,都不可避免地保留了英语的语法特征。

换言之,即便模型在与中文或法语展开交流,其内在的“思考”过程依旧是以英语为媒介,而且即便是非英语的输出,也依旧遵循着与英语相似的语法和词汇结构。

苹果英语说话__苹果的英语口语

针对大语言模型的遣词造句,研究团队提出两项量化指标:

对语言模型输出的词汇自然性进行评估,主要关注其用词是否与母语者的语言习惯相契合。

句法自然性,即考查 LLM 生成的语句是否与我国语法规范相符。

为了缩短与理想状态的差距,研究人员采用了“回译法”来自动构建训练素材,他们先将人工编写的通顺中文文本翻译成英文,随后再将这些英文内容反向翻译,生成带有“翻译腔”特征的“反面”样本。通过这类对比数据的训练,模型得以增强其自然语言的表达能力,同时在不降低基准性能的基础上,显著提升了输出的语言质量。

相关内容 查看全部