IETF提出草案披露AI生成内容 在网页响应头中声明是否为AI创作
针对人工智能生成内容越来越多的情况,互联网工程任务组 (IETF) 日前提出新草案旨在为网页响应头中添加声明,用来告诉其他爬虫或机器人此内容是否为人工智能生成。IETF 称这个标头旨在兼容 HTTP 结构化字段语法,为用户代理 (Agent)、机器人 (例如 AI 爬虫) 和归档系统 (例如互联网档案馆) 提供元数据,以上系统可以根据自己的需求决定是否采用 AI 生成的内容。
为什么要声明人工智能创作:
至少现阶段而言部分人工智能创造的内容存在低质量和错误等情况,人工智能模型可能会出现幻觉,有时候也会编造完全不存在的东西。
AI 用户代理可以代表用户抓取互联网内容并生成回答,如果引用的是人工智能模型创造的虚假内容,则生成的回答可能也是错误的或者存在不准确等问题。
归档系统例如互联网档案馆则基本不需要收藏这些由人工智能生成的内容,毕竟这些内容生成非常简单并且可能存在错误,而且人工智能可以生成海量内容,互联网档案馆这类的归档系统可以忽略人工智能创造的内容减少抓取和服务器存储压力。
因此当网站使用人工智能生成内容时就可以在标头中进行声明,AI 用户代理、爬虫等抓取内容时看到这个声明就了解这是人工智能创造的,可以选择性忽略内容避免错误。
标头语法说明:
目前提议中的语法说明以 AI-Disclosure (AI 披露) 为重点,可以声明模式、模型名称、模型提供者、校验团队、时间戳等信息,这些信息有助于其他爬虫快速识别内容来源。
AI-Disclosure:mode=ai-originated;model="gpt-4";provider="OpenAI";reviewed-by="editorial-team";date=@1745286896
需要说明的是:
以上 AI 披露标头全凭自愿,也就是说网站可以设置 AI 披露标头也可以不设置,设置 AI 披露标头代表内容由人工智能生成,但没有该标头也不一定代表网站没有使用人工智能生成内容。
现阶段这个方案还是提议阶段,草案到期时间是 2025 年 11 月 1 日,如果后续行业讨论没问题的话这个草案就会被标准化,到时候所有网站都可以可选使用 AI 披露标头。
踩一下[0]
顶一下[0]