OpenAI发布可识别AI生成文本的分类

来源：语言识别时间：2023/12/9

OpenAI在发布对话语言模型ChatGPT之后，有鉴于其强大的语言能力可能在各领域遭到滥用，因此OpenAI发布反制工具AI生成文本分类器，该工具能够用于区分由人类编写或是人工智能生成的文本，用于辅助解决自动化误导性活动和学术欺骗等问题。

OpenAI日前推出功能强大的对话语言模型ChatGPT，能以对话的方式解决用户的各种问题，包括对程序代码进行调试，与用户讨论天文、数学和文学等各个领域的议题，ChatGPT也足够聪明被证许可通过大学商学院和法学院课程考试，但不少学生却利用ChatGPT编写报告或是论文，造成教学者的困扰。

为了缓解这样的乱象，OpenAI训练能够分类人类编写的文本，以及来自各供应商人工智能技术生成的文本，官方提到，虽然不可能完全可靠地检测出所有人工智能生成的文本，但能对宣称由人编写实则由人工智能生成的文本，提供一定参考价值的判断。

这个分类器是一种语言模型，OpenAI使用同一主题的人工文本和人工智能文本资料集微调InstructGPT，只要用户输入最少1,个字符，约为到英文单词，分类器就会判断该文本是由人类编写还是人工智能产生。不过为求谨慎，OpenAI调整信度阈值以保持较低的误判率，因此即便分类器很有信心，也只会将文本标记为可能由人工智能生成。

OpenAI所发布的分类器并不完全可靠，在英文文本的评估中，分类器仅能正确地将26%的人工智能编写的文本正确分类，同时将9%由人类编写的文本，误判为人工智能生成，不过，分类器的可靠性，会因输入的文本长度增加而提高，与过去的分类器相比，这个新的分类器在判断人工智能文本上还是可靠许多。

官方提醒，目前分类器还有许多限制，不能当作主要判断的工具，仅可作为其他判断方法的补充。该分类器在少于1,个字符的短文本非常不可靠，甚至更长的文本都会被分类器错误标记，分类器甚至有时候会将人类编写的文本，有自信地错误标记为人工智能生成。

目前分类器仅能用于成人编写的英文文本，可能会在儿童书写的文本和非英文文本上出错，同时，该分类器也无法用于识别高度可预测的文本，像是无法用于预测前1,个质数是由人类编写还是人工智能生成，因为正确答案都是相同的。

其实只要稍微编辑人工智能生成的文本，就能够简单地回避分类器，官方提到，虽然他们的分类器能够更新并且再训练，但目前不清楚这种方式，以长期来说是否存在优势，而且也因为以神经网络为基础的分类器，在对训练集以外的资料表现很差，因此当用户所输入的文本跟训练资料集的文本有很大的差异，则分类器便会以高度信心做出错误判断。

转载请注明：http://www.0431gb208.com/sjsbszl/6623.html

上一篇文章： NLP中的文本分析和特征工程

下一篇文章：动态多尺度卷积网络结构,清华快手联合提