发布于 

开源日报 | ECMAScript 2024;Linux“紫屏”;新的计算范式;“开源GPT-4o”;中国首个全尺寸开源通用人形机器人

欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。

# 2024.7.4

今日要闻

ECMAScript 2024 正式发布

ECMAScript 2024(第 15 版)添加了调整 ArrayBuffers 和 SharedArrayBuffers 大小和传输功能;添加了新的 RegExp/vflag,用于创建具有更多高级功能的 RegExp,以处理字符串集;并引入了用于构建 Promises 的Promise.withResolvers便捷方法、用于聚合数据的Object.groupByMap.groupBy方法、用于异步等待共享内存更改的Atomics.waitAsync方法,以及String.prototype.isWellFormedString.prototype.toWellFormed方法,用于检查并确保字符串仅包含格式正确的 Unicode。

Visual Studio Code 1.91

Linux 内核的 Panic 界面有了二维码

Linux 6.10 引入了一个新的 DRM Panic 处理程序基础设施,以便于在出现内核致命错误 (Panic),或者 VT 支持可能被禁用的情况下显示相关信息。近日,Red Hat 的另一位内核工程师,同时也是 DRM Panic 贡献者——Jocelyn Falempe 提交了新补丁,用于在 DRM Panic 界面中显示错误消息二维码。


今日观察

社交观察

OpenAI 联合创始人 Andrej Karpathy 解释了新的计算范式

“我们正在进入一个新的计算范式,大语言模型就像CPU一样,使用Token而不是字节,并且有一个上下文窗口而不是RAM。这就是大语言模型操作系统(Large Language Model OS, LMOS)。”

- 微博  宝玉xp

玛丽大姐又写了新的报告:Al & Universities

- 微博 明浩-rosicky311

LLM指令微调教程代码开源

如果你正在寻找资源来学习LLMs指令微调过程,这里有一个开源笔记本教程可以从头开始指导你实现微调过程。

它解释了

- 如何将数据格式化为 1100 指令 - 响应对;
- 如何应用 prompt-style 模板;
- 如何使用掩码。

也包括关于实现基于 LLM的自动化评估过程的部分。

- 微博 量子位

“开源GPT-4o”来了,法国AI实验室发布原生多模态Mosh

只需8人团队4个月打造,现场惊艳演示引LeCun、Karpathy大佬转发。
 
- 模型训练流程和模型架构简单且可扩展性极强,Kyutai这样的8人以上小团队在4个月内就构建了它。合成数据在这里发挥了巨大作用

- 专注于本地设备:Moshi很快就会无处不在。Kyutai 还开发了一个较小的Moshi版本,可以在MacBook或消费级GPU上运行。

- 低延迟:延迟在300毫秒以下

官网地址:https://kyutai.org/
试用地址:https://moshi.chat/?queue_id=talktomoshi

- 微博 新智元

HR部门和人员在中美科技公司的存在感差别太大了

在美国科技公司,HR算是幕后工作人员。一般普通工程师,没事和平时一般根本感觉不到他们的存在,更别说打交道。

我在惠普、苹果和英伟达工作的17年里,从来没有和任何HR部门的人直接打过交道。离职交接也就是在网上填表,最后把设备和工牌交给部门的行政秘书就完事。我所在的部门对接的HR或HRBP,我从来不知道是谁。

- 微博 硅谷陈源博士

本地运行的开源模型桌面程序

GPT4All是一个能在消费者硬件上,在本地计算机跑语言模型的开源项目,完全支持 Mac M 系列芯片,AMD 和 NVIDIA GPU。项目组刚发布了GPT4All 项目的 1 周年纪念版(GPT4ALL 3.0,地址:blog.nomic.ai/posts/one-year-of-gpt4all),主要是对界面和 LocalDocs体验进行了重新设计。
 
着重说一下LocalDocs,这个功能允许用户使用自己的本地文件中的知识,确保数据仍然存储在本地设备,而“不会被发送给试图控制用户数据访问以改进自身 AI 技术的公司”。

- 微博 高飞

媒体观察

中国首个全尺寸开源通用人形机器人公版机“青龙”发布

在7月4日下午举行的2024世界人工智能大会暨人工智能全球治理高级别会议产业发展主论坛上,中国首个全尺寸开源通用人形机器人公版机“青龙”发布

- 第一财经

蚂蚁井贤栋:通过专业智能体的深度连接,AI会像互联网一样带来服务的代际升级

井贤栋说,在移动互联网时代,二维码让移动支付成为每个人的生活日常,“扫一扫”让小商家用最低的成本享受支付的便利。“在人工智能时代,我们也在探索,让AI像扫码支付一样便利每个人的生活,让AI技术发展的红利惠及更多人。”

- 中国经济网

AI时代,中国占到了意想不到的先手

在AI时代,中美科技竞争中,这样对中国有利的因素还会有很多。比如,依靠强大的基础设施与网络建设,从智能家居、智慧城市到工业物联网,中国能为AI技术找到广泛的应用场景,这也是其他国家很难效仿的。在农村,大量摄像头和传感器的部署,使得农业生产,如灌溉、养殖的监控,都找到了智能解决方案。能有这样一个大规模智能物联网市场的前提,依然是当初不计回报的通水、通电、通路、通网。

- 心智观察所

李彦宏:激烈的竞争环境中,商业化的闭源模型是最能打的

百度创始人、董事长兼首席执行官李彦宏在2024世界人工智能大会上,谈及开源闭源之争时表示,开源大模型在学术研究、教学领域等特定场景下有存在的价值,但并不适用于大多数应用场景。在激烈竞争的环境中,需要让业务效率比同行更高、成本比同行更低时,商业化的闭源模型是最能打的。

- 一财网

独家对话腾讯混元刘煜宏:做大模型可以有「深圳速度」,但不能跳步

大模型注定是一场长跑,「AGI 目前更像信仰」,但将腾讯混元大模型能力在内部 700 个业务上用得好,是刘煜宏认为对于 AGI 的务实追求。有远见但务实,也是混元团队在大模型上的世界观对齐。

- 今夜科技谈

新京报发布中国AI大模型测评报告,9款大模型长文本能力待提升

报告包含针对公众及传媒行业的调查问卷,新京报人工智能研究院还研发了针对大模型助手传媒能力的测评体系,本次测评共综合考察了9款大模型助手的文本生成能力、事实核查与价值观判断能力、媒体信息检索能力、翻译能力以及长文本总结能力。总体得分上,通义千问、腾讯元宝、讯飞星火夺得前三名;横向对比来看,翻译能力、事实核查与价值观判断能力两项能力最令测试员满意,而长文本能力则得分最低。

- 新京报

全球AI大模型竞赛,美、中之外还有谁?

当视线扩展到中美之外,尽管AI独角兽企业的涌现没有中美那样频繁,但它们依然像世界各地散落的珍珠,每一颗都以其独特的光芒闪耀着。从欧洲的心脏地带到亚洲的新兴市场,再到北美的科技巨头,这些大模型独角兽的发展轨迹,推动了各自国家和地区的科技创新,而且为全球人工智能技术的发展注入了多元化的视角和创新动力。

- 元素elements


今日推荐

开源项目

conan-io/conan

https://github.com/conan-io/conan

Conan 是一个去中心化、开源 (MIT)、C/C++ 包管理器。 

  • 它是完全去中心化的,用户可以私下将他们的包托管在他们的服务器上
  • 适用于所有平台,包括 Linux、OSX、Windows、Solaris、FreeBSD、Docker、WSL
  • 管理二进制文件。 它可以为任何配置和平台创建、上传和下载二进制文件, 甚至交叉编译,节省大量的开发和持续集成时间。
  • 与任何构建系统集成,包括任何专有和自定义系统。
  • 可扩展:具有强大的功能和灵活性

每日一博

大模型产品化第一年:战术、运营与战略

过去一年里,我们一直在进行构建,并在过程中发现了许多棘手的问题。虽然我们的经验并不代表整个行业,但我们希望分享自己的经验来避免同样的错误并加速迭代。我们将经验总结为以下三个部分:

战术层面 :一些关于提示、RAG、流程工程、评估和监控的实践建议。无论你是通过 LLM 进行构建的从业者,还是出于兴趣在周末进行项目开发,这部分内容都具有参考价值。

运营层面 :发布产品的日常组织和管理问题,以及组建高效团队的方法。这部分适合想要可持续且可靠地部署产品的产品 / 技术领导者。

战略层面 :长期、宏观的视角,包括诸如 “在产品市场契合(PMF)之前不要使用 GPU” 和 “专注于系统而非模型” 等有见解的观点,以及如何进行迭代。这部分为创始人和高管量身定制。


开源之声

用户观点

Linux不仅可以“蓝屏”,还可以“紫屏”、“黑屏”……

  • 观点 1:额……Windows现在的蓝屏可读性比较强,但是看目前Linux的那个蓝屏,似乎没有提升可读性,也没有提供排错指南,只是简单的把kdump由屏幕上放到了二维码上……。还不如默认把崩溃文件存储直接打开,放硬盘上好了。这样我重启下电脑还可以去读文件,然后再去查崩溃原因。说电脑屏幕有时显示不下,所以把“彩色的”蓝屏放到手机上,难道手机屏幕还大得过电脑屏幕?
  • 观点 2:这算“屎上雕花”吗?
  • 观点 3:花式嘲讽了属于是
  • 观点 4:我记得零几年的时候,我就会把一堆淘汰的硬件去攒机,目的就是挑战它能不能正常工作,并且不蓝屏~
  • 观点 5:Kernel Panic,怎么个Panic法,人家Windows报错至少代码和原因会给你写的一清二楚
  • 观点 6:啊?这是简化?
  • 观点 7:看了下解码后的数据,是个网址,报错信息被编码在URL参数中,感觉表示报错信息的数据还可以压缩一下信息密度,比如gzip压缩后编码为base64,长度会小很多
  • 观点 8:自从用了ecc内存,好像很久没蓝屏过了
  • 观点 9:windows领先十几年
  • 观点 10:有点像Linux版“黑伦”

Windows 11中国政府定制版?假的!

  • 观点 1:win11最好用的就是wsl2
    • 观点 2:其实 win10 也有 wsl2
  • 观点 3:windows 11是我用过最难用的系统,我用过的包括mac linux windows
  • 观点 4:邯郸学步,但是我觉得“邯郸”人的步伐本来就很丑。mac是我用过的最难用的系统。我很庆幸win11只学到了mac的皮毛,但痛恨其占了win10的位。
  • 观点 5:win11开始菜单效率还不如win10呢,包括不少设置选项都层层嵌套,太难找了
  • 观点 6:真不是我守旧,就win11那个右键菜单都能劝退不少人。除此之外还有一些win10上不存在的问题
    • 观点 7:还真是,原来我可以右键+字母快速解决,现在还要再加一层。凡是不能用键盘解决的问题都没有真正的解决
  • 观点 8:Win11的资源管理器bug太多了,一个文件关联的操作就有可能导致资源管理器崩溃重启,如果在这个过程中复制文件出现了这个情况,那简直就是天大的灾难。所以稳定性方面Win11还是慎用吧。
  • 观点 9:Linux distros 不好用?
  • 观点 10:我觉得 11 比 10 好用
    • 观点 11:win11好多程序闪退
  • 观点 12:win11的开始菜单和右键菜单都很难用,远不如win10
  • 观点 13:有没有可能以后有win11神州网信版本的呢,毕竟当然也是禁止机构用win10,后面不也合作搞了精简版?
  • 观点 14:win11是我用过的最难用windows
  • 观点 15:vscode的浏览器版本,除了微软自己用的以外,功能基本都是残血的,托管过的都知道。 所以有个新的挺好的。
  • 观点 16:如果不是steam的话甚至可以不用wsl
  • 观点 17:我在家里就用的 Windows ltsc

微软 WSL2 过渡至 Linux 6.6 LTS 内核

  • 观点 1:5.几就老化了?我用的还是3.10内核
    • 观点 2:那你说jdk1.8老不老
    • 观点 3:4.x之下,docker有一个隐藏bug,因为内核的原因。大部分情况不会出问题,个别情况可能会导致docker无法创建容器。当然一般情况问题不大
  • 观点 4:终于更新了,还以为wls2不维护了
  • 观点 5:wsl用的是ubuntu,追的是最新内核。

---END---

最后,欢迎扫码下载「开源中国 APP」,阅读海量技术报告、程序员极客分享!