近日,小型 AI 模型接连发布。周四,非营利 AI 研究机构 Ai2 推出 10 亿参数模型 Olmo 2 1B,在多项基准测试中超越谷歌、Meta、阿里巴巴等同类规模模型。该模型基于 Apache 2.0 许可,在 Hugging Face 平台开源,提供代码和数据集,可从头复现。相比大型模型,小型模型对硬件要求低,更易被开发者和爱好者使用。Olmo 2 1B 在 GSM8K 算术推理、TruthfulQA 事实准确性测试中表现优于同类,其基于 4 万亿 token 数据集训练,并上传训练中间检查点。
暂无讨论,说说你的看法吧