ChatGPT 标注指南来了！数据是关键-今日关注

来源：程序员客栈时间：2023-04-28 12:58:51

另外，过程中对个人敏感信息的保护和处理也是令人印象深刻，这点值得我们学习借鉴。再就是对标注人员的满意度调查，这在一定程度上也是对整个标注过程的一种评判（尤其是说明清晰这个点）。当然，这本身也是对标注人员的一种尊重，是一种不错的工作方式。

最后，简单总结一下，本文主要介绍了 InstructGPT（再次请读者谅解，我标题党了）的标注工作，全文主要从标注数据、标注人员和标注规范三个方面展开。其中标注规范是重点内容，里面主要包含了 Instruction 标注、模型输出标注和模型排序标注三部分内容，我们详细介绍了每部分的标注内容和方法，希望能够对读者有所启发。本文内容大部分来自核心参考文献，个人只是在此基础上进行了二次加工整合，如果想了解更多细节和 Case，可以阅读这些文献。

文献参考

核心文献

【1】Long Ouyang, Training language models to follow instructions with human feedback, OpenAI, 2022【2】[PUBLIC] InstructGPT: Final labeling instructions - Google Docs【3】[PUBLIC] InstructGPT: Toxicity labeling instructions - Google Docs【4】[External] [UPDATE] Labeling PII in instructions - Google Docs

相关文献

【1】ChatGPT: Optimizing Language Models for Dialogue【2】https://platform.openai.com/playground【3】Tom B. Brown, Language Models are Few-Shot Learners, 2020【4】https://en.wikipedia.org/wiki/Likert_scale【5】Sumanth Dathathri, Plug and Play Language Models: A Simple Approach to Controlled Text Generation, Uber AI, 2019【6】Ben Krause, GeDi: Generative Discriminator Guided Sequence Generation, Salesforce Research, 2021【7】Ximing Lu, Quark: Controllable Text Generation with Reinforced Unlearning, Allen AI, 2022【8】https://www.perspectiveapi.com/how-it-works/

标签：

上一篇：小米(01810)人工智能实验室声学语音团队获“全国工人先锋号”荣誉称号每日头条

下一篇：关注：石家庄市气象台2023年04月28日09时39分发布大风蓝色预警

上一页 1 2 3 4 5 6 7 8 9 下一页