开源日报 | ECMAScript 2024；Linux“紫屏”；新的计算范式；“开源GPT-4o”；中国首个全尺寸开源通用人形机器人

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。

# 2024.7.4

今日要闻

ECMAScript 2024 正式发布

ECMAScript 2024（第 15 版）添加了调整 ArrayBuffers 和 SharedArrayBuffers 大小和传输功能；添加了新的 RegExp/vflag，用于创建具有更多高级功能的 RegExp，以处理字符串集；并引入了用于构建 Promises 的Promise.withResolvers便捷方法、用于聚合数据的Object.groupBy和Map.groupBy方法、用于异步等待共享内存更改的Atomics.waitAsync方法，以及String.prototype.isWellFormed和String.prototype.toWellFormed方法，用于检查并确保字符串仅包含格式正确的 Unicode。

Visual Studio Code 1.91

Linux 内核的 Panic 界面有了二维码

Linux 6.10 引入了一个新的 DRM Panic 处理程序基础设施，以便于在出现内核致命错误 (Panic)，或者 VT 支持可能被禁用的情况下显示相关信息。近日，Red Hat 的另一位内核工程师，同时也是 DRM Panic 贡献者——Jocelyn Falempe 提交了新补丁，用于在 DRM Panic 界面中显示错误消息二维码。

今日观察

社交观察

OpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式

“我们正在进入一个新的计算范式，大语言模型就像CPU一样，使用Token而不是字节，并且有一个上下文窗口而不是RAM。这就是大语言模型操作系统（Large Language Model OS, LMOS）。”

- 微博 宝玉xp

玛丽大姐又写了新的报告：Al & Universities

- 微博 明浩-rosicky311

LLM指令微调教程代码开源

如果你正在寻找资源来学习LLMs指令微调过程，这里有一个开源笔记本教程可以从头开始指导你实现微调过程。

它解释了

- 如何将数据格式化为 1100 指令 - 响应对；
- 如何应用 prompt-style 模板；
- 如何使用掩码。

也包括关于实现基于 LLM的自动化评估过程的部分。

- 微博 量子位

“开源GPT-4o”来了，法国AI实验室发布原生多模态Mosh

只需8人团队4个月打造，现场惊艳演示引LeCun、Karpathy大佬转发。

- 模型训练流程和模型架构简单且可扩展性极强，Kyutai这样的8人以上小团队在4个月内就构建了它。合成数据在这里发挥了巨大作用

- 专注于本地设备：Moshi很快就会无处不在。Kyutai 还开发了一个较小的Moshi版本，可以在MacBook或消费级GPU上运行。

- 低延迟：延迟在300毫秒以下

官网地址：https://kyutai.org/
试用地址：https://moshi.chat/?queue_id=talktomoshi

- 微博 新智元

HR部门和人员在中美科技公司的存在感差别太大了

在美国科技公司，HR算是幕后工作人员。一般普通工程师，没事和平时一般根本感觉不到他们的存在，更别说打交道。

我在惠普、苹果和英伟达工作的17年里，从来没有和任何HR部门的人直接打过交道。离职交接也就是在网上填表，最后把设备和工牌交给部门的行政秘书就完事。我所在的部门对接的HR或HRBP，我从来不知道是谁。

- 微博 硅谷陈源博士

本地运行的开源模型桌面程序

GPT4All是一个能在消费者硬件上，在本地计算机跑语言模型的开源项目，完全支持 Mac M 系列芯片，AMD 和 NVIDIA GPU。项目组刚发布了GPT4All 项目的 1 周年纪念版（GPT4ALL 3.0，地址：blog.nomic.ai/posts/one-year-of-gpt4all），主要是对界面和 LocalDocs体验进行了重新设计。

着重说一下LocalDocs，这个功能允许用户使用自己的本地文件中的知识，确保数据仍然存储在本地设备，而“不会被发送给试图控制用户数据访问以改进自身 AI 技术的公司”。

- 微博高飞

今日推荐

开源项目

conan-io/conan

https://github.com/conan-io/conan

Conan 是一个去中心化、开源 (MIT)、C/C++ 包管理器。

它是完全去中心化的，用户可以私下将他们的包托管在他们的服务器上
适用于所有平台，包括 Linux、OSX、Windows、Solaris、FreeBSD、Docker、WSL
管理二进制文件。它可以为任何配置和平台创建、上传和下载二进制文件，甚至交叉编译，节省大量的开发和持续集成时间。
与任何构建系统集成，包括任何专有和自定义系统。
可扩展：具有强大的功能和灵活性

每日一博

大模型产品化第一年：战术、运营与战略

过去一年里，我们一直在进行构建，并在过程中发现了许多棘手的问题。虽然我们的经验并不代表整个行业，但我们希望分享自己的经验来避免同样的错误并加速迭代。我们将经验总结为以下三个部分：

战术层面 ：一些关于提示、RAG、流程工程、评估和监控的实践建议。无论你是通过 LLM 进行构建的从业者，还是出于兴趣在周末进行项目开发，这部分内容都具有参考价值。

运营层面 ：发布产品的日常组织和管理问题，以及组建高效团队的方法。这部分适合想要可持续且可靠地部署产品的产品 / 技术领导者。

战略层面 ：长期、宏观的视角，包括诸如 “在产品市场契合（PMF）之前不要使用 GPU” 和 “专注于系统而非模型” 等有见解的观点，以及如何进行迭代。这部分为创始人和高管量身定制。

开源之声

用户观点

Linux不仅可以“蓝屏”，还可以“紫屏”、“黑屏”……

观点 1：额……Windows现在的蓝屏可读性比较强，但是看目前Linux的那个蓝屏，似乎没有提升可读性，也没有提供排错指南，只是简单的把kdump由屏幕上放到了二维码上……。还不如默认把崩溃文件存储直接打开，放硬盘上好了。这样我重启下电脑还可以去读文件，然后再去查崩溃原因。说电脑屏幕有时显示不下，所以把“彩色的”蓝屏放到手机上，难道手机屏幕还大得过电脑屏幕？

观点 2：这算“屎上雕花”吗？

观点 3：花式嘲讽了属于是

观点 4：我记得零几年的时候，我就会把一堆淘汰的硬件去攒机，目的就是挑战它能不能正常工作，并且不蓝屏～

观点 5：Kernel Panic，怎么个Panic法，人家Windows报错至少代码和原因会给你写的一清二楚

观点 6：啊？这是简化？

观点 7：看了下解码后的数据，是个网址，报错信息被编码在URL参数中，感觉表示报错信息的数据还可以压缩一下信息密度，比如gzip压缩后编码为base64，长度会小很多

观点 8：自从用了ecc内存，好像很久没蓝屏过了

观点 9：windows领先十几年

观点 10：有点像Linux版“黑伦”

Windows 11中国政府定制版？假的！

观点 1：win11最好用的就是wsl2

观点 2：其实 win10 也有 wsl2

观点 3：windows 11是我用过最难用的系统，我用过的包括mac linux windows

观点 4：邯郸学步，但是我觉得“邯郸”人的步伐本来就很丑。mac是我用过的最难用的系统。我很庆幸win11只学到了mac的皮毛，但痛恨其占了win10的位。

观点 5：win11开始菜单效率还不如win10呢,包括不少设置选项都层层嵌套,太难找了

观点 6：真不是我守旧，就win11那个右键菜单都能劝退不少人。除此之外还有一些win10上不存在的问题

观点 7：还真是，原来我可以右键+字母快速解决，现在还要再加一层。凡是不能用键盘解决的问题都没有真正的解决

观点 8：Win11的资源管理器bug太多了，一个文件关联的操作就有可能导致资源管理器崩溃重启，如果在这个过程中复制文件出现了这个情况，那简直就是天大的灾难。所以稳定性方面Win11还是慎用吧。

观点 9：Linux distros 不好用？

观点 10：我觉得 11 比 10 好用

观点 11：win11好多程序闪退

观点 12：win11的开始菜单和右键菜单都很难用，远不如win10

观点 13：有没有可能以后有win11神州网信版本的呢，毕竟当然也是禁止机构用win10，后面不也合作搞了精简版？

观点 14：win11是我用过的最难用windows

观点 15：vscode的浏览器版本，除了微软自己用的以外，功能基本都是残血的，托管过的都知道。所以有个新的挺好的。

观点 16：如果不是steam的话甚至可以不用wsl

观点 17：我在家里就用的 Windows ltsc

微软 WSL2 过渡至 Linux 6.6 LTS 内核

观点 1：5.几就老化了？我用的还是3.10内核

观点 2：那你说jdk1.8老不老

观点 3：4.x之下，docker有一个隐藏bug，因为内核的原因。大部分情况不会出问题，个别情况可能会导致docker无法创建容器。当然一般情况问题不大

观点 4：终于更新了，还以为wls2不维护了

观点 5：wsl用的是ubuntu，追的是最新内核。

---END---

最后，欢迎扫码下载「开源中国 APP」，阅读海量技术报告、程序员极客分享！

开源日报 | ECMAScript 2024；Linux“紫屏”；新的计算范式；“开源GPT-4o”；中国首个全尺寸开源通用人形机器人https://www.oschina.net/news/300429

本文采用 GLWT（Good Luck With That，祝你好运）公共许可证许可协议，转载请注明出处。