清华系千亿基座对话模型ChatGLM开启内测

由清华技术成果转化的公司智谱 ai 宣布开源了 glm 系列模型的新成员 —— 中英双语对话模型 chatglm-6b，支持在单张消费级显卡上进行推理使用。这是继此前开源 glm-130b 千亿基座模型之后，智谱 ai 再次推出大模型方向的研究成果。
此外，基于千亿基座的 chatglm 线上模型目前也在 chatglm.cn 进行邀请制内测，用户需要使用邀请码进行注册，也可以填写基本信息申请内测。
根据介绍，chatglm-6b 是一个开源的、支持中英双语问答的对话语言模型，并针对中文进行了优化。该模型基于 general language model (glm) 架构，具有 62 亿参数。结合模型量化技术，用户可以在消费级的显卡上进行本地部署（int4 量化级别下最低只需 6gb 显存）。
chatglm-6b 使用了和 chatglm 相同的技术，针对中文问答和对话进行了优化。经过约 1t 标识符的中英双语训练，辅以监督微调、反馈自助、人类反馈强化学习等技术的加持，62 亿参数的 chatglm-6b 虽然规模不及千亿模型，但大大降低了推理成本，提升了效率，并且已经能生成相当符合人类偏好的回答。
chatglm-6b 具备以下特点：
充分的中英双语预训练：chatglm-6b 在 1:1 比例的中英语料上训练了 1t 的 token 量，兼具双语能力。
优化的模型架构和大小：吸取 glm-130b 训练经验，修正了二维 rope 位置编码实现，使用传统 ffn 结构。6b（62 亿）的参数大小，也使得研究者和个人开发者自己微调和部署 chatglm-6b 成为可能。
较低的部署门槛：fp16 半精度下，chatglm-6b 需要至少 13 gb 的显存进行推理，结合模型量化技术，这一需求可以进一步降低到 10gb（int8）和 6gb（int4），使得 chatglm-6b 可以部署在消费级显卡上。
更长的序列长度：相比 glm-10b（序列长度 1024），chatglm-6b 序列长度达 2048，支持更长对话和应用。
人类意图对齐训练：使用了监督微调（supervised fine-tuning）、反馈自助（feedback bootstrap）、人类反馈强化学习（reinforcement learning from human feedback）等方式，使模型初具理解人类指令意图的能力。输出格式为 markdown，方便展示。
基于以上特点，chatglm-6b 在一定条件下具备较好的对话与问答能力。chatglm-6b 的对话效果展示如下：
不过由于 chatglm-6b 模型的容量较小，不可避免地存在一些局限和不足，包括：
相对较弱的模型记忆和语言能力。在面对许多事实性知识任务时，chatglm-6b 可能会生成不正确的信息，也不太擅长逻辑类问题（如数学、编程）的解答。
可能会产生有害说明或有偏见的内容：chatglm-6b 只是一个初步与人类意图对齐的语言模型，可能会生成有害、有偏见的内容。
较弱的多轮对话能力：chatglm-6b 的上下文理解能力还不够充分，在面对长答案生成和多轮对话的场景时，可能会出现上下文丢失和理解错误的情况。
相比起 chatglm-6b，chatglm 参考了 chatgpt 的设计思路，在千亿基座模型 glm-130b 中注入了代码预训练，通过有监督微调（supervised fine-tuning）等技术实现人类意图对齐。chatglm 线上模型的能力提升主要来源于独特的千亿基座模型 glm-130b。它采用了不同于 bert、gpt-3 以及 t5 的 glm 架构，是一个包含多目标函数的自回归预训练模型。
glm 团队表示，2022 年 11 月，斯坦福大学大模型中心对全球 30 个主流大模型进行了全方位的评测，glm-130b 是亚洲唯一入选的大模型。在与 openai、google brain、微软、英伟达、meta ai 的各大模型对比中，评测报告显示 glm-130b 在准确性和公平性指标上与 gpt-3 175b (davinci) 接近或持平，鲁棒性、校准误差和无偏性则优于 gpt-3 175b。
由 chatglm 生成的对话效果展示：
不过 glm 团队也坦言，整体来说 chatglm 距离国际顶尖大模型研究和产品（比如 openai 的 chatgpt 及下一代 gpt 模型）还存在一定的差距。该团队表示，将持续研发并开源更新版本的 chatglm 和相关模型。“欢迎大家下载 chatglm-6b，基于它进行研究和（非商用）应用开发。glm 团队希望能和开源社区研究者和开发者一起，推动大模型研究和应用在中国的发展。”

为什么程序员最好别创业
中国的智慧城市怎样发展
如何在i.MXRT1170上快速点亮一款全新LCD屏？
Flash纯固态激光雷达，需要更高分辨率的SPAD阵列
苹果造车的优势在哪里?
清华系千亿基座对话模型ChatGLM开启内测
AT&T宣布在美国全国范围内将再裁员1800人
光电倍增管探测范围
关于自动驾驶从技术层面走向商业化的发展现状及趋势研究详解
升压芯片FP6291在充电电池中的应用
51单片机p0口上拉电阻的选择，应该遵循哪些设计原则？
移动商务神器年货节选三星Galaxy Tab S7就对了！
ApiBoot Logging使用Rest Template透传链路信息
耐高压透明液压节流阀的原理及设计
高低温湿热试验箱的简单故障分析
新型EPWM斩波器式交流稳压电源的原理分析
康佳T953S彩电开关电源的改进
fpga全球市场_fpga国内外研究现状
工业互联网已成为5G应用的主战场
品鉴一下祖传SQL脚本调优方法