问:加入网络需要什么?
答:成为网络的一部分意味着我们可能会联系您,询问测试新模型或在已部署的模型上测试感兴趣的领域的机会。作为网络一部分进行的工作是根据保密协议 (NDA) 进行的,尽管我们历来在系统卡和博客文章中发布了许多红队调查结果。您将因花在红队项目上的时间而获得补偿。
问:加入网络的预期时间是多少?
答:您决定提交的时间可以根据您的日程安排进行调整。请注意,并非每次机会都会联系网络中的每个人,OpenAI 将根据特定红队项目的合适情况进行选择,并在后续红队活动中强调新观点。即使一年只有 5 个小时对我们来说仍然很有价值,所以如果您有兴趣但时间有限,请毫不犹豫地申请。
问:申请人何时会收到录取通知?
答: OpenAI 将滚动选择网络成员,您可以在 2023 年 12 月 1 日之前申请。在此申请期之后,我们将重新评估未来再次申请的机会。
问:成为网络的一部分是否意味着我将被要求对每个新模型进行红队?
答:不,OpenAI 将根据特定红队项目的合适程度进行选择,您不应期望测试每个新模型。
问:您在网络成员中寻找的标准是什么?
答:我们正在寻找的一些标准是:
- 在与红队相关的特定领域表现出专业知识或经验
- 热衷于提高人工智能安全
- 无利益冲突
- 多元化的背景和传统上代表性不足的群体
- 多样化的地理代表性
- 流利掌握一种以上语言
- 技术能力(非必需)
问:还有哪些其他协作安全机会?
答:除了加入网络之外,还有其他合作机会可以为人工智能安全做出贡献。例如,一种选择是对人工智能系统创建或进行安全评估并分析结果。
OpenAI 的开源Evals存储库(作为GPT-4 发布的一部分发布)提供了用户友好的模板和示例方法来快速启动此过程。
评估范围可以从简单的问答测试到更复杂的模拟。作为具体示例,以下是 OpenAI 开发的评估样本,用于从多个角度评估人工智能行为:
劝说
- MakeMeSay:一个人工智能系统如何欺骗另一个人工智能系统说出秘密单词?
- MakeMePay:一个人工智能系统如何说服另一个人工智能系统捐款?
- 投票提案:人工智能系统对另一个人工智能系统对政治提案的支持的影响程度如何?
隐写术(隐藏消息)
- 隐写术:人工智能系统在不被另一个人工智能系统捕获的情况下传递秘密消息的能力如何?
- 文本压缩:人工智能系统压缩和解压缩消息以隐藏秘密消息的能力如何?
- Schelling Point:在没有直接通信的情况下,人工智能系统与另一个人工智能系统的协调能力如何?
我们鼓励在评估人工智能系统时发挥创造力和实验精神。完成后,我们欢迎您将您的评估贡献给开源Evals存储库,以供更广泛的 AI 社区使用。
您还可以申请我们的研究人员访问计划,该计划提供学分来支持研究人员使用我们的产品来研究与负责任地部署人工智能和减轻相关风险相关的领域。
暂无评论