
智动作者程前编辑李水清智动新闻11月26日讯,11月24日,字节跳动科技副总裁杨振源在2025年度字节跳动奖学金颁奖典礼上致辞。他宣布,PICO将于2026年发布新品。为了提高虚拟物体与现实世界与MR技术的融合,PICO自主研发了整个MR设备链路的专用消费级芯片。该项目于2022年6月立项,2024年开拍,现已进入量产。实际测量表明系统芯片延迟约为12毫秒。 ▲字节跳动副总裁杨振源 杨振源2014年加入字节跳动,距离他第一次帮助字节跳动创始人张一鸣构建新的推荐算法,已经快12年了。他在演讲中回顾了字节跳动节点的一些重要技术进展:2014年,他们利用大型机器学习系统构建了一个recom补正制度。只有5个人,他们只能选择两个人分别负责一个优化器解决方案; 2020年,字节跳动开始探索科学计算产生的有价值的数据; 2021年,它收购了Pico。 2023年,由于硬件经验不足,内部决定减少内容和营销投入,加强技术投入。从技术成果来看,目前PICO最终产品的平均PPD(每度像素)已达到40,中心区域超过45,属于行业领先水平;通过定制microoled,提高XR设备的清晰度; Byte Full Link打造的消费级MR头显专用芯片目前已进入量产。最后,在大模型方面,Byte内部的员工在2021年训练了大型语言模型,但当时他们认为大型模型目前没有用处。杨振源表示,这也说明了d 他们当时没有远见。这也对应了PICO此前曝出的产品计划变更、过时、计划开发MR设备的情况。 2023年12月,外媒报道消息称,Pico计划取消原来的Pico 5研发计划,转而开发一款高端MR耳机,对标Apple Vision Pro。与此同时,PICO还宣布失踪和重新安置工作已开始,将其2023年初1800多人的团队削减至800多人。今年7月,PICO宣布正在开发MR设备,计划将数字内容叠加在现实世界视图上,直接对标即将推出的轻量级MR设备。以下为演讲全文主要内容摘要: 2014年,张一鸣想利用大型机器学习系统开发一个推荐系统,解决各种媒体形式的推荐,包括即时通讯。年龄、文字和视频。他们计划在2014年实现万亿级的特征规模。杨振源提到了这背后在优化算法方面的挑战。 LR优化是一项成熟的技术,但不同方法的效率和影响正在发生变化——差异很大。当时Byte只有5个人,我们只能选两个人负责两套优化器方案,同时进行研究。 2014年底,Byte逐步引入FM算法,最终演变成更通用的深度学习系统。今天发现专注于模型训练的LinkStreaming更新和浅层神经网络算法在推荐方面仍然有不错的效果。 2020年,他们意识到科学计算可以产生大量有价值的数据。字节跳动探索第一原理计算和分子动力学。今年,字节与比亚迪成立联合实验室,将高通ghput 使用科学计算算法进行自动化实验,探索人工智能在电池材料科学中的工业应用。目前,GPU加速的DFT计算、力场+分子动力学模拟、预测+设计模型已被Byte Enterprise Partners投入实际应用。 2021年,字节收购了PICO团队,开始同时推广两条产品路线。一是聚焦现有的产品形态,同时投入资源运营视频、直播等内容,更加激进的营销;另一些则是投资核心技术,追求更高水平的核心体验。杨振源宣布,2023年内部决定减少内容和营销投入,更加坚定技术投入。这是因为当时的产品硬件经验尚未成熟,无法支持大众市场应用。杨振元列举了PICO目前正在探索的几条技术路线包括 XR、MR 和交互设备清晰度。在清晰度方面,他们的最终产品的平均 PPD(每度像素)为 40,其中中心区域超过 45。杨振源表示,肯定是行业顶尖水平。 PPD是指人眼每度可以看到多少个像素。 PPD超过30就可以阅读文字,40会比较清晰,60的视觉感受接近视网膜级别的清晰度。为了提高XR设备的清晰度,PICO和供应商在2022年推出了microoled的定制,这使得光学显示系统可以进一步缩小,让MR耳机变得轻薄,同时实现更高的PPI和性能赋予清晰度。 MR设备需要特殊的芯片。 2022年6月,字节跳动成立内部项目,全面研发MR耳机专用的消费电子芯片。该芯片将于2024年量产,目前已进入量产阶段,各项指标均满足要求他的设计要求。实际测试表明系统延迟可高达12毫秒。杨振源表示,这并不容易。尽管世界领先的公司使用软件来做到这一点,但很难在不显着牺牲图像质量的情况下将延迟降低到 25 毫秒以下。在交互层面,PICO构建了专业的高精度测试系统、专门的3D重建机制和高精度数据采集系统,高精度识别真实环境。 2023年,进入大机型时代,字节跳动开始大举投资。 2021年,Byte的内部员工训练了大型语言模型,但其内部用于改善搜索发现结果的情况并没有得到改善。所以他们当时得出的结论是,现在大型模型已经不怎么使用了。杨振源说,这也说明他们当时没有眼光。自2022年投资以来,豆宝已成为最受欢迎的AI对话助手在中国。根据IDC报告,火山发动机在中国马斯市场排名第一。杨振源还分享了他的想法,如何评估AGI的愿景,一是如何提高大规模模型的学习能力,二是IO的能力,也就是AI与世界交互的能力。演讲全文地址:https://mp.weixin.qq.com/s/wtn9e5xxwaaamr2ymnumua
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储服务。
注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。