科技日报讯 (记者张梦然)最新一期《自然》杂志发表的一篇论文称,谷歌深度思维团队开发了一种能为大语言模型生成文本添加水印的工具,可提高对合成内容的鉴别和追溯能力。
大语言模型(LLM)是广泛使用的人工智能(AI)工具,能为聊天机器人、文章写作和其他目的生成文本。不过,人们很难识别并追溯AI生成文本的来源,使信息的可靠性受到质疑。水印被认为能解决这一问题,但生产系统对质量和计算效率的严格要求阻碍了其规模化应用。
深度思维团队此次利用一种全新采样算法,开发出一个给AI生成文本添加水印的系统——SynthID-Text。该工具通过采样算法对LLM的词汇选择进行巧妙偏移,插入一个能被相关检测软件识别的签名。这既可以通过一种“扭曲”路径实现(能提高水印质量但会轻微影响输出质量),也可以通过另一种能保留文本质量的“非扭曲”路径实现。
深度思维已在多个公开模型上评估了这些水印的可检测性,结果显示,SynthID-Text的可检测性优于当前其他方法。
他们还用Gemini LLM的近2000万次在线对话,评估了这些文本的质量,最终认为非扭曲水印形式不会降低文本质量。此外,使用SynthID-Text对LLM运行所需算力的影响可忽略不计,从而减少了应用上的障碍。
该研究证明,为生成式文本添加水印是可行的,其可提高AI使用的责任和透明度。