华为昇腾回应“大模型演示造假”：并非调取预置图片

2024-05-17 744 0

作者: 记者 来源: 观察者网

　　5月16日，针对网传华为大模型文生图现场疑似人工调取预置图片的消息，华为昇腾社区回应称，现场图片为实时生成，调用的是开源大模型，并非调取预置图片。

　　事件起源于5月10日的鲲鹏昇腾开发者大会，当时在一场面向开发者的技术讨论会上，华为演示了mxRAG SDK功能，展示如何通过十几行代码即可完成RAG应用开发。

　　网传视频及聊天截图显示，华为在演示文生图功能时，按下Crtl-C中断，显示对应代码为time.sleep(6)，有网友解释称，代码的意思是暂停6秒，然后调取预置图片展示出来。

　　此消息一出，立刻引发网友对技术能力真实性的讨论。有部分观点质疑，这是华为大模型能力演示造假，指控华为利用time.sleep(6)来模拟生成，实际是人工调取预置图片。

　　网传鲲鹏昇腾开发者大会现场图片

　　针对网络上的质疑，昇腾社区回应称，现场图片为实时生成，调用的是开源大模型。代码中有time.sleep(6)等表述，是命令等待读取外部开源大模型实时生成的图片，并非调取预置图片。本次展示的均为真实代码，也将在昇腾社区上开放，欢迎开发者使用并提出宝贵建议。

　　根据公开资料，mxRAG的功能为检索（Retrieval）、增强（Augmentation）和生成（Generation）。这一能力是目前开发大语言模型（LLM）所需的重要能力之一。

　　一些学术资料显示，LLM+RAG被应用于包问答系统、聊天机器人、事实验证、金融领域的决策支持等多个领域，未来还可以提高模型的可信度，开发多语言和多模态的RA-LLMs等。

　　尽管华为已公开回应，对于此次事件，网上多种观点仍在辩论。

　　华为昇腾社区官网截图

　　一些行业人士认为，time.sleep(6)可能是为了确保程序在演示过程中不会出现意外情况，而预设的一个缓冲步骤。这样的做法在技术演示中并不少见，目的是为了展示过程的平稳和可控。

　　也有专家指出，大模型的计算和生成过程确实需要时间，而time.sleep(6)可能是为了展示模型计算的实际耗时。在AI领域，模型的计算速度是衡量技术先进性的重要指标之一。

　　但同时也有开发者认为，文生图过程理论上“完全没必要sleep(6)”。

　　截止目前，华为此次展示的mxRAG SDK功能，还未在开发者资源下载中心上线。而由于昇腾社区暂未公布源代码，开发者目前也仅能通过网传代码截图进行经验判断和讨论。

相关文章