新闻你的位置:kaiyun体育最新版 > 新闻 > 开云kaiyun他们还在 GitHub 上公开了最终代码-kaiyun体育最新版
开云kaiyun他们还在 GitHub 上公开了最终代码-kaiyun体育最新版

发布日期:2026-02-20 04:55    点击次数:127

  

开云kaiyun他们还在 GitHub 上公开了最终代码-kaiyun体育最新版

IT之家 12 月 30 日音尘开云kaiyun,一个名为 EXO Labs 的组织本日在应答媒体上发布了一段视频,展示了一台动手 Windows 98 系统的 26 年乐龄的奔腾 II 电脑(128MB 内存)得手动手大型言语模子(LLM)的情形。随后,EXO Labs 在其博客上发表了一篇详备著作,进一步推崇了这个技俩的细节,以过头“栽植东说念主工智能”的愿景。

IT之家防卫到,视频中一台 350MHz 的 Elonex 奔腾 II 电脑启动 Windows 98 后,EXO Labs 动手了基于 Andrej Karpathy 的 Llama2.c 开导的定制纯 C 推理引擎,并让 LLM 生成了一个对于“Sleepy Joe”的故事。令东说念主讶异的是,通盘这个词进程动手流通,故事生成速率也十分可不雅。

EXO Labs 由牛津大学的商讨东说念主员和工程师构成,于本年 9 月认真对外亮相,其奇迹是“栽植东说念主工智能”。该组织以为,少数大型企业规矩东说念主工智能会对文化、真相以及社会其他基本方面形成负面影响。因此,EXO Labs 但愿“构建绽放的基础秩序,以锤真金不怕火前沿模子,并使任何东说念主皆能在职何场合动手它们”,从而让泛泛东说念主也能在简直任何确立上锤真金不怕火和动手 AI 模子。这次在 Windows 98 上动手 LLM 的豪举,恰是对这一理念的有劲证实。

把柄 EXO Labs 的博客著作,他们从 eBay 上购得了一台旧式 Windows 98 电脑。有关词,将数据传输到这台老机器上却是一个挑战,他们最终通过其以太网端口使用“迂腐的 FTP”完成了文献传输。

更大的挑战在于为 Windows 98 编译当代代码,运道的是他们找到了 Andrej Karpathy 的 llama2.c,这是一个“用 700 行纯 C 代码即可在 Llama 2 架构的模子上动手推理”的器具。借助这一资源以及旧式的 Borland C++ 5.02 IDE 和编译器(以及一些小的周折),EXO Labs 得手将代码编译成可在 Windows 98 上动手的可推行文献。他们还在 GitHub 上公开了最终代码。

EXO Labs 的 Alex Cheema 极端感谢了 Andrej Karpathy 的代码,并对其性能传颂不已,称其在使用基于 Llama 架构的 26 万参数 LLM 时,在 Windows 98 上终局了“每秒 35.9 个 token”的生成速率。值得一提的是,Karpathy 曾任特斯拉东说念主工智能主宰,亦然 OpenAI 的首创团队成员之一。

固然 26 万参数的 LLM 领域较小,但在这台迂腐的 350MHz 单核电脑上动手速率十分可以。把柄 EXO Labs 的博客,使用 1500 万参数的 LLM 时,生成速率略高于每秒 1 个 token。而使用 Llama 3.2 10 亿参数模子时,速率则相配迟缓,仅为每秒 0.0093 个 token。

EXO Labs 的主义远不啻于在 Windows 98 机器上动手 LLM。他们在博客著作中进一步推崇了其对改日的预测,并但愿通过 BitNet 终局东说念主工智能的栽植。

据先容,“BitNet 是一种使用三元权重的 transformer 架构”,使用这种架构,一个 70 亿参数的模子只需要 1.38GB 的存储空间。这对于一台 26 年前的奔腾 II 来说可能仍然有些贫乏,但对于当代硬件致使十年前确凿立来说,皆相配轻量级的。

EXO Labs 还强调,BitNet 是“CPU 优先”的开云kaiyun,幸免了对上流 GPU 的依赖。此外,据称这种类型的模子比全精度模子成果高 50%,而况可以在单个 CPU 上以东说念主类阅读速率(约每秒 5 到 7 个 token)动手一个 1000 亿参数的模子。

告白声明:文内含有的对外跳转纠合(包括不限于超纠合、二维码、口令等面容),用于传递更多信息,从简甄选时辰,驱散仅供参考,IT之家通盘著作均包含本声明。

]article_adlist-->   声明:新浪网独家稿件,未经授权附近转载。 -->

Powered by kaiyun体育最新版 @2013-2022 RSS地图 HTML地图

Powered by365站群