解密大脑的人

【编者按】在上海市科学技术委员会资助(项目编号:22DZ2304300)下,澎湃新闻对获得国家及上海市科技奖励的获奖成果进行科普化报道。

本文围绕2020年度上海市自然科学奖一等奖项目“视觉信息处理与行为发生的神经机制”展开,该项目由中国科学院脑科学与智能技术卓越创新中心杜久林、穆宇、李莹、姚园园、张白冰完成。

中国科学院脑科学与智能技术卓越创新中心研究员杜久林。

没有人是一座孤岛。细胞,也是如此。神经元,即神经细胞,更甚。

杜久林的办公室在一排实验室中间。穿过长长的走廊,来到他办公室。电脑屏幕上闪烁着一个复杂、美妙的图像——紫色、蓝色、红色的光点点缀,荧光短线条彼此交错、连接,又分开枝杈,指向远方。

那是他和团队成员正在努力解开的神秘“宇宙”——大脑。他是中国科学院脑科学与智能技术卓越创新中心的研究员。

视觉中国 资料图

杜久林说,这是人类遇到的最复杂、最神秘的系统。“我们现在的大脑,是亿万年生物演化的产物。”它的功率很小,只有数十瓦。但功能很强大,是目前最先进新的人工智能无法望其项背的。它是怎么形成的,运行规则是什么?为什么会导致疾病?这些秘密都还若隐若现,离揭开谜底还有很长的路要走。在人工智能蓬勃发展的现在,解密大脑的重要意义更加凸显,可以启发新的人工智能构架和算法的研发

起初,他们从视觉和行为入手,试图一窥大脑的“算法”

由杜久林、穆宇、李莹、姚园园、张白冰完成的“视觉信息处理与行为发生的神经机制”项目荣获2020年度上海市自然科学技术奖一等奖。该项目以斑马鱼为脊椎动物模型,研究视觉活动从视网膜到大脑的反应与作用过程,揭示神经调节系统在此过程中的作用机制,并阐明其结构连接组,对理解大脑工作原理有重要推进作用。

现在他们采用新的研究方法和体系,“既见森林,又见树木,甚或树叶”,向全脑的解析出发。

中国科学院脑科学与智能技术卓越创新中心杜久林研究组。

“我们都是带电体”

“人家原来说谈朋友(恋爱)来‘电’,其实很有道理。大脑里所有的信号处理都是以电的方式。本质上所有的信息流都是电信号的信息流。”杜久林说。

他进一步解释,但是外界的很多信号、感觉刺激多数不是电的形式,而是其他物理形式的,比如光的、机械力的、化学分子的。神经系统进化出一些细胞,能够把各种不同的物理能量转变成电信号。而大脑就是一个处理“电”的复杂系统,然后,用电信号来最终支配肌肉细胞的收缩和舒张,支配人的行为、心理、生理活动等。“所以,本质上来讲,我们都是一个带电体,用电信号打交道。”

人是如何看到物体的?

这个过程有点复杂。

神经元是信息传递的“高速公路”或“电缆”。在大脑里,信息传递的过程一路火花带闪电,还有化学物质的产生和消耗,如五羟色胺、乙酰胆碱等;甚至“信息”是有形状的——不同的信息,会带来不同脑区的空间位置上不同神经元的电发放。

一束光经过物体表面,进入人的眼睛,落到视网膜上。在这里,物理信号被转化为神经信号,比如电火花。这些电信号被传入大脑的视觉中枢,描摹出物体的轮廓、形状、颜色、速度等。

1967年诺贝尔生理学或医学奖被授予了三位科学家——Ragnar Granit、Haldan Keffer Hartline 和 George Wald,以表彰他们对眼睛主要生理和化学视觉过程的发现。

其中,哈佛大学的生物学教授George Wald揭示了视网膜的化学组成,特别是视紫红质(rhodopsin)在光线下的变化。

1981年诺贝尔生理学或医学奖被授予David H. Hubel 和 Torsten N. Wiesel。他们观察不同形状和亮度的物体如何激活猫大脑皮层中的特定神经元,揭示了大脑视觉皮层是如何分级处理视觉信息的。

虽然在一瞬间我们就完成了“看见”这个过程,但至今人们还不清楚对颜色或色温的感知是如何实现的。更复杂的是,光子本身并没有颜色。不同颜色的光的差异仅仅在于波长。正如不同气味的化学分子本身并没有气味,但大脑赋予了它们万千不同。

0.1立方毫米的“宇宙”:从视觉和行为机制入手和解析

“一个成年人的大脑里面有接近1,000亿(1011)个神经元,它们形成的连接总数大约有百万亿个(1014),而且是有序的连接。银河系里面恒星的数量级也是千亿级别,这是外部宇宙。大脑其实是我们的内部宇宙。”杜久林说。

面对如此复杂的一个“内部宇宙”,我们如何解密其功能和工作原理?

他表示,视觉其实是研究大脑的一个窗口。

五、六万条体长仅3-5厘米的小鱼,组成了国内最大的斑马鱼研究平台之一,由杜久林课题组管理。这里也是全脑介观神经联接图谱研究平台(斑马鱼)。

斑马鱼早期的胚胎是透明的,成鱼全身布满多条深蓝色条纹,像是斑马一样,其基因和人类的相似度达到87%。它被称为“水中小白鼠”,作为模式动物,在揭开生命科学诸多奥秘的历程中为人类提供助攻。

杜久林表示,人类接收到的信息80%左右来自视觉。在神经科学领域,视觉研究一直占据着重要地位。“研究斑马鱼让我意识到,不能小瞧0.1立方毫米的迷你大脑,它可以撬动整个脑科学的发展历程。”

动物对不同感觉刺激的反应是生存的关键。以往的研究多集中在“感觉系统”的信息处理上,例如视觉通路如何加工形状、颜色、运动等信息。但感觉系统将信息处理后传入大脑,视觉刺激的行为意义如何被大脑处理,以及大脑如何根据这些意义调控行为尚不清楚。

为了揭开这一谜团,杜久林团队利用斑马鱼作为研究对象,采用了一系列先进的神经生物学研究技术,包括在体电生理记录、光遗传学激活和钙成像等技术。

作为视觉系统的第一站,长期以来,视网膜信号处理被认为是相对稳定,而没有可塑性。但杜久林研究组发现,视网膜突触传递具有神经活动依赖的长时程可塑性,从而动态调节视觉信号的处理,修正了传统的观点。

此外,杜久林研究组发现,大脑中免疫细胞-小胶质细胞会对视觉中枢神经元的视觉信号进行稳态调节。这一发现揭示了一种新的视觉信号的调控方式,被国际学术期刊《神经元》(Neuron)期刊评为领域近年最具有影响力的工作,被认为是揭开小胶质细胞生理功能的开创性工作。

亮或暗偏好是动物的本能行为。杜久林研究组发现,大脑左侧缰核通过接受双侧丘脑输入,在亮偏好行为中起枢纽作用,揭示了脊椎动物介导亮偏好行为的神经环路机制。

此外,大脑缰核与人类的情绪有关。杜久林表示,目前已有临床研究人员根据相关研究,开发利用特殊光照射方法对抑郁患者进行干预或治疗的方案。

斑马鱼对具有危险性的视觉刺激产生逃跑行为。他们研究发现,对这一行为的控制发生在从视觉信息传递到逃跑命令神经元的阶段。

研究进一步揭示,当斑马鱼接收非危险性视觉刺激时,多巴胺能神经元及其正向调控的抑制性神经元电活动增加,阻断了视觉信息的传递,使得斑马鱼不会因非危险刺激而逃跑。当斑马鱼接收到危险性视觉刺激时,这两种神经元的活动受到抑制,解除了视觉信息传递的抑制,斑马鱼产生逃跑反应。

多巴胺能神经元和后脑甘氨酸能抑制性神经元组成的功能模块,相当于“交通指挥员”,帮助动物在复杂的环境中做出正确的行为选择——是逃跑,还是留下来。这表明神经调质系统可以被感觉刺激调制,从而帮助动物产生相应的行为反应。

该研究增进了人们对感觉-运动信息转换控制神经机制的理解,以及对神经调质系统在行为选择中作用的认识。

视觉会影响听觉?在大脑中,视觉信号与其它感觉信号的跨膜态互作是动物感知复杂环境的基础。杜久林研究组发现,视觉信号通过激活下丘脑多巴胺神经元,调节听觉通路的信号编码和听觉行为的发生,阐明了视觉跨模态调节听觉功能的神经环路机制。

“既见森林,又见树木,甚或树叶”:从局部脑区迈向全脑解析

杜久林十分注重科学研究中的思想体系和技术体系的构建与发展,“要有思想地工作。每日投身工作之际,都需要保持深度思考;要在研究中逐步形成自己的研究体系,包括思想体系和实验体系”。

2006年1月1日,从美国留学归来的杜久林决定要建一个自己的研究体系。“既见森林,又见树木(神经元),甚或树叶”,是他的体系和策略。其中,“森林”是指全脑,“树木”是指神经元,树叶是指“突触”。

而他认为最重要是一个视角,或思维方式是,需要站在漫长的生物演化的未来时间节点上,以上帝视角,回头看看,重新审视、评估、考量自己正在进行研究和正在回答的问题,然后前行。

“现在神经科学的发展,客观上来讲,还处于对局部脑区有限维度的了解。某个脑区怎么样产生某个行为的,哪些神经元产生哪种行为。”“相当于春秋战国阶段一城一池的较量。”“做斑马鱼,并不是为了做斑马鱼。”杜久林说。

他希望通过对斑马鱼的研究,来了解神经系统的架构、功能和底层“游戏规则”,即算法。

人类大脑有接近1000亿个神经元,而斑马鱼大脑只有大约10万个神经元。而二者都是脊椎动物。

杜久林表示,在基因-信号通路-神经元形态与功能-神经环路等多个层次上,脊椎动物的大脑结构与功能具有高度的保守性。脑科学研究处于关键的历史拐点,正从聚焦于研究局部脑区推进到在全脑尺度上探索神经系统结构的设计原理和神经信息的处理机制。在实验观察方法和数据分析手段上,从宏观(脑区分辨率)、介观(细胞分辨率)、抑或微观(突触分辨率)层面上,斑马鱼是目前唯一一个可以从全脑尺度上解读脑工作原理的模式脊椎动物。

荧光标记的斑马鱼大脑。荧光标记的斑马鱼大脑。(绿色:神经细胞;红色/黄色:血管。)

一个透明或半透明的斑马鱼的大脑,经过处理,被切成薄如蝉翼甚至更薄的薄片。然后在电子显微镜下拍照,读取神经元的连接情况,绘图,并进行人工校对。

这将是第一个脊椎动物的全脑微观神经联接图谱。杜久林表示,谷歌等国际科技巨头也在抢时间,争夺这个“第一”。

因为是透明的,斑马鱼的全脑研究具有独特的优势。“对于很多动物不透明的大脑,目前的技术能够记录到神经元的范围是有限的。但斑马鱼不一样,在显微镜下面,它大脑里面所有的细胞一览无余。甚至10万个神经元,我们全部能看到。”他说。

仅用于呈现斑马鱼0.1立方毫米的大脑的图像数据,就有约250TB(太比特)。而这还只是一个静态的大脑构造的数据。

意识到斑马鱼的全脑研究优势时,很多技术还没有发展起来。他带领课题组成员一起闯难关,开发各种多学科交叉技术。

“我们刚刚开始做斑马鱼的时候,国际上大概只有十来个实验室做斑马鱼的神经系统功能研究。我们一边做科学研究,一边发展新的技术,然后推进自己科研,同时这个领域也会受益。”杜久林说。

如果知道一个发动机或发电机内线圈的缠绕方式,我们可以制作一台同样的装置吗?可以知道它的运行法则、规律,甚至“想法”吗?除非去尝试,否则没有人知道答案。

“有了这个数据以后,我们可以完全地还原一个复杂系统,一个能耗非常低、被优化了数亿年的智能系统——斑马鱼的大脑,然后用复杂系统的科学理论方法来分析其结构上的特点,研究其信息的编码、交流机制。”杜久林说,“实际上,我们看到10万个神经元的活动,是相当于鱼的世界都在里面。鱼的思想、所有肢体的运动,甚至内脏器官的运动,都蕴含在其中。”

神经科学研究领域面临的一个关键难题是大数据的实时处理。他解释说,一个米粒都要比斑马鱼大脑大很多倍。通过光学成像,斑马鱼大脑中获得的全脑神经活动的数据流量每一秒钟达到500GB数量级,需要快速地处理完,再反馈到控制器上。分析的目标是,信息在这个复杂系统里是怎么流动的?哪些细胞产生或调控它?电信号是从哪个脑区的哪个细胞接收来的,又送到哪个脑区的哪个细胞,最终作出了什么样的加工,控制了什么运动等?

“目前的神经科学研究主要是分析网络的节点活动,复杂系统则偏重分析网络中的信息流。复杂系统产生的数据,可以反映和提取该系统的特征。以后各个学科的发展普遍会涉及大数据的处理。不同学科、不同体系,都是一个具象化的复杂系统,是大数据产生及其应用的不同场景,或者讲大数据是其共同的一个抽象层面。” 杜久林说。

杜久林透露,“我们近期突破了一个技术难关——全脑神经细胞活动的大数据实时处理,并基于此技术,实现了大数据流的光学脑机接口;结合人工神经网络等技术,实现了大脑神经网络和人工神经网络的交互,从而将目前神经科学家普遍使用的开环实验范式升级到实时闭环研究新范式,这将会推动人工智能在神经科学研究中的应用(即AI4Neuroscience),同时也会促进神经科学研究对人工智能发展的作用(即Neuroscience4AI)。”

OpenAI硬件战略调整,计划2026年起生产自研AI芯片

10月30日,据路透社报道,OpenAI将进行硬件战略调整,旨在优化计算资源和降低成本。OpenAI将引入AMD的MI300系列芯片,同时继续使用英伟达(Nasdaq:NVDA)的GPU。此外,OpenAI还与博通(Broadcom Inc.)和台积电(TSMC)合作,计划于2026年开始生产自研的定制AI芯片。

路透社在报道中提及,OpenAI已组建了由约20名工程师组成的芯片开发团队,其中包括曾参与谷歌Tensor处理器项目的高级工程师。但是,按照OpenAI目前的时间表,定制芯片的真正生产预计要到2026年才能实现。

OpenAI此前主要依赖英伟达的GPU进行模型训练和推理。目前,英伟达的GPU占据超过80%的市场份额,但芯片短缺、英伟达AI算力卡供不应求、成本上升等问题导致OpenAI正寻求替代方案。

通过引入AMD的MI300系列芯片,OpenAI不仅能够确保高性能计算,还能分散供应风险。

除了引入AMD芯片,OpenAI 正在与博通合作开发新的定制芯片,旨在处理其用于AI推理的大型负载,并与台积电合作以确保具备芯片制造能力。

OpenAI原本计划建立一个芯片制造厂网络,但由于成本和时间限制,这项计划已暂时搁置。目前OpenAI将重点投入内部芯片设计,与博通和台积电等行业伙伴合作,以确保芯片供应的稳定性。

训练像ChatGPT这样的AI模型成本高昂。根据此前报道,OpenAI预计今年将亏损50亿美元,而收入为37亿美元。计算成本,即处理大规模数据集和开发模型所需的硬件、电力和云服务费用,是该公司最大的支出。

目前,英伟达的GPU占据了超过80%的硬件市场份额。由于芯片供应短缺和价格上升,促使OpenAI开始探索AI硬件的内部开发或外部替代方案。这一策略与亚马逊、Meta、谷歌和微软等科技巨头相似,即通过定制芯片降低成本并确保AI硬件的获取渠道。但是,谷歌、微软和亚马逊在这一领域的努力已经领先了几个阶段,OpenAI可能需要大量资金才能具备真正的竞争力。

今年10月,OpenAI刚完成66亿美元(约合人民币463亿元)新一轮融资,该轮融资由Thrive Capital领投,微软、英伟达、Altimeter Capital、富达基金、软银及阿布扎比国家支持的MGX投资公司参投,投后估值达1570亿美元。OpenAI希望利用这些资金加强算力资源,持续扩展其AI工具和技术研究的能力。

自主研制+最大直径,我国又一超大直径盾构机“江海号”下线

10月31日,一台最大开挖直径达16.64米的超大直径盾构机在湖南长沙下线,将应用于目前世界最长公路水下盾构隧道——海太长江隧道施工。这是我国迄今自主研制的最大直径盾构机,标志着国产超大直径盾构机产业化取得新突破。

“江海号”将应用于海太长江隧道施工

这台盾构机取名为“江海号”,由中国铁建重工集团、中铁十四局集团联合打造,整机长约145米,总重量约5000吨。记者在现场了解到,“江海号”是以海太长江隧道工程跨越长江、毗邻大海两个意向融合命名,其刀盘涂装有向前进击的蔚蓝色巨浪,寓意着盾构机将聚力潜行、通达江海。

海太长江隧道位于江苏省长江入海口区域,北起南通海门区,南至苏州太仓市。工程线路全长39.07公里,过江隧道长11.185公里,采用双向六车道高速公路设计标准,设计速度为100公里每小时。其中盾构隧道段长9315米,最大开挖直径达16.64米,沿线需穿越淤泥质粉质黏土夹粉土与粉细砂复合地层等复杂地质带,最大埋深约75米,最高水压达7.5巴,具有超长距离、超大直径、超高水压、超大埋深、复杂工况等特点。

“江海号”将面临多项挑战

中铁十四局海太长江隧道项目高级工程师宋欢介绍,盾构机将在长江水下完成超长距离独头掘进,特别是在穿越长江及两岸大堤时,沉降要求控制在1厘米之内,施工难度大,且江中地质勘探覆盖的区域有限,不可控的未知区域多,犹如“摸石头过河”。超16.6米超大直径意味着盾构机刀盘开挖所需扭矩大,对主驱动轴承负载大;7.5巴超高水压对主驱动密封、盾尾密封等部件的承压能力要求高,在保持较高性能负载的前提下,如何保证整机在江底复杂环境中连续掘进9315米是研制团队面临的主要挑战和难题。

中国铁建重工集团掘进机研究设计院高级工程师范瑞强介绍,针对项目施工风险和难点,研制团队通过创新攻关,在刀盘刀具、主驱动等关键部件上采取针对性设计,配置具有常压换刀功能的软土刀盘和合金大、硬度高、覆盖广、耐磨强的切削刀具,主驱动配置伸缩功能,可感知刀盘整体受力,有效避免特殊情况下刀盘异常受力造成的主轴承过载,方便换刀作业、辅助刀盘脱困,并配置主驱动状态监测系统,对主驱动运行状态进行连续监控。同时,因地制宜设计盾体外形尺寸、结构厚度,增大油缸规格,优化泥浆环流系统和注浆系统等,强化整机性能,配置管片连接构件智能拼装系统,满足工程施工需求。

据介绍,研制团队还结合多年来在水下和大直径盾构隧道施工经验,通过加大盾构机刀盘开口率,配置高压力、大流量的中心冲刷系统及刀盘结泥饼预警系统,并搭配伸缩摄像装置,无需人员带压进舱即可观察刀盘工作区域情况,有效判别和降低刀盘结泥饼风险,提高底部排渣效率。同时还应用自主研发的第四代同步注双液浆技术,实现盾构隧道沉降的毫米级精度控制,保证施工安全及效率。

我国超大直径盾构机研制实现新跨越

据了解,业界通常把14米及以上直径盾构机称为超大直径盾构机。“江海号”是继直径16.07米“京华号”成功下线并应用后,我国企业自主研制的又一超大直径盾构机。“江海号”的成功下线,标志着我国企业在16米级超大直径盾构机研制和应用领域实现新跨越,已形成超大直径盾构机全产业链产业化发展能力。

海太长江隧道是《长江干线过江通道布局规划(2020-2035年)》和《江苏省长江经济带综合立体交通运输走廊规划》重点推动建设项目,也是江苏“十四五”重点推进的过江通道项目,计划于2028年基本建成。建成后,可以有效分流苏通长江大桥的流量,对落实长三角区域一体化发展和长江经济带发展国家战略,优化长江干线过江通道布局,推动沿江城市群跨江融合发展等具有重要意义。

“世界模型”究竟是什么?会成为人工智能的下一个前沿领域吗?

·世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。

·尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。此外,世界模型也存在幻觉问题。

近年来,人工智能(AI)领域涌现出一种被称为“世界模型”(World Models)或“世界模拟器”的新概念,被一些行内人士视为AI的下一个重大前沿。AI领域的领军人物李飞飞创立的World Labs(世界实验室)已筹集了2.3亿美元资金,致力于构建“大型世界模型”(LWM);与此同时,谷歌DeepMind也聘请了OpenAI视频生成器Sora的创造者之一,参与“世界模拟器”的研究。

什么是“世界模型”?近日,科技媒体TechCrunch的高级记者凯尔·威格斯(Kyle Wiggers)撰文,梳理了关于“世界模型”的一系列问题,以下是澎湃科技(www.thepaper.cn)编译。

什么是世界模型?

世界模型的灵感源于人类自然形成的世界心智模型。我们通过感官获取的抽象信息在大脑中被转化为对周围世界的具象理解;这些“模型”早在人类开始研究AI之前就已存在。基于这些模型,我们的大脑对世界进行预测,从而影响我们的感知和行动。

AI研究人员大卫·哈(David Ha)和尤尔根·施米德胡伯(Jürgen Schmidhuber)以棒球击球手为例,论述了击球手只有几毫秒的时间决定如何挥棒,这比视觉信号传递到大脑的时间还短。他们之所以能击中时速160公里的快速球,是因为他们能本能地预测球的位置。

两位研究人员写道:“对于职业选手来说,这一切都是在潜意识中完成的。他们的肌肉会反射性地在正确的时间和位置挥棒,与其内在心智模型的预测一致。他们可以快速根据对未来的预测而采取行动,但无需有意识地推演可能的未来情景以制定计划。”

正是这种世界心智模型的潜意识推理能力,让一些科技研究者认为,世界模型是实现人类级别智能的前提。

世界模型有哪些应用潜力?

尽管这个概念已经存在了几十年,世界模型最近因其在生成式视频领域的应用而备受关注。目前,大多数AI生成的视频都会陷入“恐怖谷”现象,观看时间稍长就会出现画面崩坏,如四肢扭曲或融合。

传统的生成式模型可能能够准确预测篮球会弹跳,但并不真正理解其中的原因,就像大型语言模型实际上是基于神经网络的概率推理,给出最可能符合读者预期的答案,而非真正理解词语和短语背后的意义。然而,具有基本物理认知的世界模型将更善于展现“篮球的真实弹跳”。

为了实现这种洞察力,世界模型需要在大量的照片、音频、视频和文本数据上进行训练,旨在创建对世界运作方式的内部表征,并具备推理行动后果的能力。

Snap前AI主管、现Higgsfield公司CEO亚历克斯·马什拉博夫(Alex Mashrabov)表示:“观众期望他们观看的世界与现实相似。如果一根羽毛以铁砧的重量下落,或者保龄球飞上数百英尺的高空,这会让观众出戏。有了强大的世界模型,创作者就无需定义每个物体的运动方式——这既繁琐又低效——因为模型将能够自行理解原理。”

然而,改进视频生成只是世界模型的冰山一角。包括Meta首席AI科学家杨立昆(Yann LeCun)在内的研究人员认为,这些模型未来可用于数字和物理领域的复杂预测和规划。

在今年早些时候的一次演讲中,杨立昆描述了世界模型如何通过推理来实现目标。一个具有基础“世界”表示(例如一段脏房间的视频)的模型,给定一个目标(干净的房间),可以推导出一系列行动(使用吸尘器、清洗餐具、倒垃圾)来实现目标。这并非因为它观察到了这种模式,而是因为它在更深层次上理解了事物如何从脏到净。

“我们需要能够理解世界的机器;具备记忆、直觉和常识的机器——能够像人类一样推理和规划的机器,”杨立昆表示。“尽管你可能听到一些最热情之人的吹嘘,但当前的人工智能系统并不具备这些能力。”

虽然杨立昆估计我们距离他设想的世界模型至少还有十年的时间,但当今的世界模型已经显示出其作为基本物理模拟器的前景。

OpenAI 在一篇博客中认为 Sora 是一个世界模型,可以模拟画家在画布上留下画笔笔触等动作。像 Sora 这样的模型——以及 Sora 本身——也可以有效地模拟视频游戏。例如,Sora 可以渲染类似 Minecraft 的UI和游戏世界。

World Labs 联合创始人贾斯汀·约翰逊(Justin Johnson)在a16z播客的一集中表示,未来世界模型可能能够按需生成3D世界,用于游戏、虚拟摄影等。

“我们已经有能力创建虚拟的交互式世界,但这需要花费数亿美元和大量的开发时间,”约翰逊表示,“‘世界模型’不仅可以让用户获得图片或视频片段,还可以获得一个模拟效果完备、充满活力的交互式 3D 世界。”

实现世界模型面临哪些技术挑战?

尽管这一概念令人振奋,但仍有许多技术挑战亟待解决。与目前用于生成式模型的计算量相比,训练和运行世界模型需要庞大的算力。虽然一些最新的语言模型可以在现代智能手机上运行,但Sora(多少算一种早期世界模型)需要数千个GPU来训练和运行,尤其是在其使用变得普及的情况下。

世界模型和所有AI模型一样,也会产生幻觉,并内化训练数据中的偏见。一个主要由欧洲城市晴天视频训练的世界模型,可能难以理解或正确描绘韩国城市的雪景。

亚历克斯·马什拉博夫指出,训练数据的匮乏可能会加剧这些问题。“我们已经看到模型在生成某种类型或种族的人物时受到限制,”他说。“世界模型的训练数据必须足够广泛,以涵盖多样化的情景,同时也要足够具体,使AI能够深入理解这些情景的细微差别。”

AI初创公司Runway的CEO克里斯托瓦尔·瓦伦苏埃拉(Cristóbal Valenzuela)在最近的一篇文章中表示,数据和工程问题阻碍了当前模型准确捕捉世界中生物(如人类和动物)行为的能力。“模型需要生成一致的环境地图,”他说,“并具备在这些环境中导航和互动的能力。”

世界模型能为具身智能提供技术基础

如果所有主要障碍都被克服,亚历克斯·马什拉博夫认为,世界模型可以“更稳定地”将AI与现实世界连接起来,不仅在虚拟世界生成方面,而且也在机器人技术和AI决策方面取得突破。

这也可能催生更强大的机器人。如今的机器人在功能上受到限制,因为它们缺乏对周围现实世界(或自身身体)的意识。世界模型可以为它们提供这种意识,至少在一定程度上可以。

“有了先进的世界模型,AI可以对其所处的任何情境形成自身的理解,”他说,“并开始推理出可能的解决方案。”

世界模型能够为人工智能提供理解真实的三维物理世界的能力,使人形机器人真正感知真实世界,对具身智能的实现具有重大意义。

燧原科技创始人张亚林:AI发展的关键目标是要让大家都用得起

·由于国内人工智能算力产业起步较晚、基础较差,目前国产AI算力能否真正被使用且易用,这是国产算力芯片面临的重大挑战。

张亚林指出,算法迭代和应用更新是推动AI前进的原动力,没有算法和大模型的持续更新和迭代,以及各种应用场景的层出不穷,人工智能的发展依然可能是昙花一现。真正的AI公司必须通过深度结合场景,打造高性价比产品,以实现人工智能的广泛应用。他认为,当前AI算力能否真正被使用并易用,这是国产算力芯片面临的重大挑战。

燧原科技创始人张亚林

在创立燧原科技之前,张亚林曾在AMD工作了11年,他带领AMD上海研发中心成功开发并量产多颗旗舰处理器;近日,张亚林获得了2023年度上海市科学技术奖青年科技杰出贡献奖。

张亚林表示,从技术发展角度来看,大模型让人工智能实现了从感知和判断到生成和创造的巨大跨越,正在快速重塑数字时代的发展模式。

人工智能要落地,必须通过与场景的深度结合,进行系统化、集约化的赋能,打造高性价比的产品。举例而言,可以通过AI技术对目前已有的互联网应用进行深度赋能和升级,打造出更好的性价比和商业回报,进一步增加用户的黏性和付费意愿,让广告、推荐、搜索等高回报率的应用进一步深入人心。这样的方式才能真正实现人工智能第一波的应用落地。

张亚林认为,现在的人工智能离真正能够带来的社会价值、生产力价值和商业价值,还有一定的距离。人工智能现在依然是一个赋能型的工具,还没有真正达到高层次的人工智能,还是处在一个协助赋能的阶段。但他预测,在未来的十年内一定会有超级人工智能,或者更高级的通用人工智能出现。到那个时候,可以指望人工智能不仅仅是赋能,而是真正有效地解决人和企业的运作问题。

伴随商业化应用不断向纵深推进,大模型推理市场被大大拓展和激活,也随之带来了智能算力需求的增加。AI训练要求高性能、高存储、高带宽,追求极致计算能力;而AI推理算力要求高效能、低功耗、低延时,追求极致性价比。

由于国内人工智能算力产业起步较晚、基础较差,目前国产AI算力能否真正被使用且易用,这是国产算力芯片面临的重大挑战。在国产化替代的大背景之下,破除产业壁垒,加强协同合作,构建合作共赢的AI算力生态体系是必经之路。以原始创新的软硬件架构开发产品,这是唯一正确且必须坚持的路线。

今年5月,由燧原科技产品提供支撑的宜昌点军智算中心实现运营。张亚林指出,智算中心是一个至少3-5年长周期的落地运营过程,需要投建方、运营方、使用方一起合作共赢。在张亚林看来,人工智能这些年的发展,早已从底层的芯片,走向了一个集成的系统。“这样一个大的系统,需要从十几个维度统筹去解决问题。我们认为一个公司必须把核心的领域掌握在自己手里,比如成本结构掌握在自己手里,把整个系统的设计链条成本降到最低,复杂度降到最低,最终才能产生一个最佳性价比的产品。”

过赤道了,“雪龙2”号驶入南半球

由自然资源部组织的中国第41次南极考察队在本月初从广州正式出征,奔赴南极。考察队分别搭乘“雪龙”号和“雪龙2”号科考船,由于两船船速不同,今天上午(6日),“雪龙2”号刚刚穿越赤道。

目前,“雪龙”号和“雪龙2”号已经先后穿越赤道,下一步,两艘船都将面临南半球西风带的考验。

亚马逊拟再向OpenAI最大竞争对手Anthropic投资数十亿美元

据科技媒体The Information日前报道,亚马逊正与人工智能初创公司Anthropic商讨第二笔大规模投资,金额数十亿美元。这将是自去年9月亚马逊宣布对Anthropic投资40亿美元以来的新一轮财务承诺。但此次投资附带特殊条件,亚马逊要求Anthropic在训练人工智能模型时,使用由亚马逊自研芯片驱动的云服务器。

Anthropic由前OpenAI高管Dario Amodei和Daniela Amodei兄妹联合创立,被认为是OpenAI的最大竞争对手。Anthropic已筹集97亿美元,接近OpenAI筹资总额219亿美元的一半。今年年初,Anthropic预计,随着训练和扩大其人工智能产品,2024年将消耗超过27亿美元。据The Information报道,几个月来,Anthropic一直在讨论以400亿美元的估值进行新的融资。

Anthropic和亚马逊此次谈判的重点在于Anthropic同意采用多少亚马逊的芯片,这将直接影响亚马逊的总投资规模。对Anthropic而言,转向使用亚马逊自研的Trainium芯片可能面临技术挑战。亚马逊的配套软件尚不如开发者熟悉的英伟达Cuda软件成熟。此外,这可能增加Anthropic对亚马逊Trainium服务器的依赖,限制其未来选择其他云服务提供商或自建数据中心的灵活性。而亚马逊则希望推动Anthropic采用自家芯片,减少对英伟达芯片的依赖。参与双方讨论的知情人士表示,作为最初合作的一部分,Anthropic已同意使用部分Trainium服务器,但主要仍依赖英伟达的服务器。

据报道,在新一轮投资中,Anthropic与亚马逊的任何投资交易可能以可转换票据形式进行,这些票据将在Anthropic从其他投资者处成功融资后转换为股权。双方还在就一项云协议展开谈判,根据该协议,双方将共同分享向亚马逊云客户销售Anthropic模型的收入,Anthropic则同意从亚马逊租用专用服务器来开发其技术。

除了与亚马逊的合作,Anthropic还与谷歌建立了规模较小的云合作关系。去年谷歌承诺向Anthropic投资20亿美元,不过反垄断机构英国竞争和市场管理局10月份宣布启动调查。该机构将确保对人工智能行业的大规模科技投资不会扭曲市场,防止少数科技公司占据主导地位。

月之暗面创始人被前公司投资人提起仲裁

国内人工智能创业明星公司月之暗面(Moonshot AI)创始人杨植麟被曝遭投资人提起仲裁?对此,月之暗面11月11日向澎湃科技(www.thepaper.cn)回应称,杨植麟已委托律师,将依法提出抗辩。

据澎湃科技(www.thepaper.cn)记者了解,此前申请仲裁的是杨植麟此前参与创立的公司循环智能的投资人,包括:金沙江创投、靖亚资本、博裕资本、华山资本和万物资本。

知情人士表示,此次仲裁申请可能缘起于,在尚未拿到来自循环智能的上述投资方的同意豁免书之前,杨植麟和其他创始人就已启动融资并创立月之暗面。

澎湃科技注意到,循环智能成立于2016年,是一家面向企业营销客服的AI软件提供商。公司最初由杨植麟、张宇韬和陈麒聪三位联合创始人共同建立,三人均为技术出身,结识于清华大学的知识工程实验室。杨植麟曾在卡内基梅隆大学(CMU)攻读博士,师从苹果公司AI负责人Ruslan Salakhutdinov和Google AI首席科学家William W. Cohen。陈麒聪在CMU攻读计算机硕士,师从亚马逊AWS AI负责人Alex Smola。张宇韬在清华大学攻读计算机博士,师从数据挖掘专家唐杰教授。

在循环智能的早期阶段,三位联合创始人均分股权,但杨植麟并非CEO,而是主要负责AI和产品,担任首席科学家一职。陈麒聪担任CEO,张宇韬任CTO。

月之暗面成立于2023年4月,主打产品为Kimi智能助手。自成立以来,公司融资进展迅速,备受业界关注。今年2月,月之暗面获得了由红杉中国、小红书、阿里巴巴等投资的超10亿美元A+轮融资,估值达到约25亿美元。8月又有媒体报道称,月之暗面完成了超3亿美元的新一轮融资,腾讯参与了本轮投资,该公司估值升至33亿美元,使其成为国内AI“六小龙”中估值最高的企业。

在尚未获得循环智能部分投资方的同意豁免书之前,杨植麟和张宇韬已启动融资并创立了月之暗面。这可能引发了部分投资方的不满,认为在股权和竞业等方面存在争议。据36氪旗下投资报道账号“暗涌Waves”报道,目前循环智能时期的投资人已经在中国香港提起仲裁,相关电子仲裁申请书也已递交HKIAC(香港国际仲裁中心)。

值得注意的是,前金沙江创投管理合伙人张予彤在月之暗面融资过程中发挥了重要作用。其也是循环智能的首个天使轮投资人,并曾代表金沙江创投在循环智能的董事会中。随着月之暗面估值的迅速攀升,这可能给循环智能时期的老投资人带来了一定的压力和冲击。

业内人士认为,此次仲裁可能对月之暗面的后续融资和发展产生一定影响,但具体结果有待仲裁机构的裁定。

聚上海·创未来·赛青春:快来参加上海大学生创新创业大赛

第二届“上证杯”“海聚英才”上海大学生创新创业大赛通知

为贯彻落实习近平总书记给中国国际大学生创新大赛参赛学生代表的回信精神,凝聚科技创新的青春力量,推动教育、科技、人才“三位一体”高质量融合发展,深化拔尖创新人才的培养和引进,更好服务促进上海高水平人才高地建设。打造“以赛引才、以赛选才、以赛聚才”赛事平台,激发青年大学生创新创业活力,促进人才、技术、产业等深度融合,助力上海成为海内外青年大学生的向往之地、创新创业之地、价值实现之地,让广大青年在中国式现代化的广阔天地中更好展现才华。

根据海聚英才全球创新创业大赛总体安排,定于2024年11月至2025年5月举办第二届“上证杯”“海聚英才”上海大学生创新创业大赛(以下简称大赛)。现将有关事项通知如下。

大赛主题:聚上海·创未来·赛青春

组织机构

(一)指导单位

上海市人才工作领导小组办公室、上海市教育委员会

(二)主办单位

上海市科创教育指导委员会

(三)承办单位

上海市学生事务中心、上海市科技艺术教育中心;

复旦大学、上海交通大学、同济大学、华东师范大学、上海大学、上海理工大学;

万博科创促进中心

(四)协办单位

世界顶尖科学家协会上海中心、上海市欧美同学会留美分会、长三角国家技术创新中心、中国教育学会科创教育协作体、上海市白玉兰国际友好交流基金会、上海市各高校及部分国内外高校等

(五)特别支持单位

黄浦区人民政府、金山区人民政府

上海市就业促进中心、上海市大学生科技创业基金会

上海市中小微企业政策性融资担保基金管理中心

(六)战略合作单位

上海证券交易所公益基金会、国泰君安证券股份有限公司

(七)执行机构

大赛设立组织委员会(以下简称组委会),由上海市科创教育指导委员会负责同志担任主任,负责大赛的组织实施;

大赛设立专家委员会,负责项目评审等工作;

大赛设立纪律与监督委员会,负责对赛事组织、参赛项目评审、协办单位相关工作等进行监督,对违反大赛纪律的行为予以处理;

大赛设立秘书处负责日常相关工作。

赛事设置

参赛项目设置

本次大赛设置六大赛道,由复旦大学、上海交通大学、同济大学、华东师范大学、上海大学、上海理工大学分别承办,各赛道均分创意组、创业组,均接受国内项目和国际项目。总决赛在上海举行。

参赛项目组别

本次大赛各赛道分创意组、创业组。

1.创意组:参赛项目具有科技创新成果或商业经营推广价值的创新创意产品,在大赛通知下发之日前尚未完成工商等各类登记注册。

2.创业组:参赛项目具有较高的科技创新性或成型的产品、服务模式,完成工商等各类登记注册未满5年(自通知发布之日起计算),并且所获机构、个人股权投资不超过一轮次,项目所在单位的股权结构中项目负责人的股权不得少于10%。

大赛聚焦领域及赛道

1.生物医药(下设单元赛道,创新医药单元赛道:主要聚焦新靶标、新位点、新机制、新分子实体,重点发展抗体药物、新型疫苗、基因治疗、细胞治疗等高端生物制品,靶向化学药及新型制剂,现代中医药等;医疗器械单元赛道:主要聚焦高端影像设备、高端植介入器械及耗材、手术治疗及生命支持设备、高端康复辅具、体外诊断仪器和试剂、生物医用材料等;现代医疗服务单元赛道:主要聚焦临床前及临床合同研发(CRO)、合同研发生产(CMO/CDMO)、康养医疗服务等;医疗数字化单元赛道:主要聚焦人工智能辅助药物开发、数字医疗解决方案等)赛道,由复旦大学承办。

2.人工智能、科技金融(元宇宙、 AI 基础层、 AI 技术层、 AI 场景应用、通用技术、虚拟现实等)赛道,由上海交通大学承办。

3.文化创意及产业创新(下设单元赛道,文化教育赛道:文化娱乐、影视游戏、在线教育等;设计创意赛道:工业设计、服务设计、体验经济等;乡村振兴赛道:乡村振兴、社区更新等;现代服务赛道:新零售、食品科技及产品、新物流及供应链等)赛道,由同济大学承办。

4.新一代信息技术(集成电路、通信网络、工业互联网、网络与信息设备、网络与信息安全服务、软件开发等)赛道,由华东师范大学承办。

5.新能源、新材料、节能环保(新能源产品与技术、动力电池、碳中和、资源回收与综合利用等)赛道,由上海大学承办。

6.高端装备制造(仪器和传感器、智能制造装备、轨道交通装备、智能汽车、航空航天装备、海洋工程装备等)赛道,由上海理工大学承办。

参赛对象及要求

1.参赛项目负责人应为国际、国内高校(含职业院校)在校生(包括本专科生、研究生),或毕业5年以内的学生(即2019年之后的毕业生),以及国家开放大学学生。

2.参赛项目负责人须为该项目或创业组织的第一创始人或核心团队成员,创业组需要持有该单位的股份(对于参评人持有股份的形式可以是直接持有和间接持有)。

3.参赛项目应弘扬正能量,践行社会主义核心价值观,真实、健康、合法。不得含有任何违反《中华人民共和国宪法》及其他法律法规的内容。参赛项目须为原创性创新项目,所涉及的发明创造、专利技术、资源等必须拥有清晰合法的知识产权或物权。如有抄袭盗用他人成果、提供虚假材料等违反相关法律法规或违背大赛精神的行为,一经发现即刻丧失参赛资格、所获奖项等相关权利,并自负一切法律责任。

赛程安排

大赛时间为:2024年11月-2025年5月

大赛启动(2024年11月)

项目征集(2024年11月-2025年4月8日)

参赛团队通过大赛官方网站(网址:https://hjyc.youkehulian.com)报名,提交参赛信息表、项目商业策划书和答辩PPT、身份证明、承诺书、参赛证明等材料(详情请见附件1-4)。要求项目商业策划书的PPT 至少 10 页 (不计封面及目录页),内容需包括但不限于:项目介绍、产品价值、团队介绍、竞争优势、市场化能力、过往业绩、发展前景等。

大赛组委会将开展赛事宣讲会、参访会、政策宣讲会、项目推介会、专家报告等系列活动,具体安排另行通知。

项目评审

国际国内不同来源项目分别按创意组、创业组开展评审。

1.初赛评选(2025年4月中旬)

由各赛道承办高校组织专家网上评审。评委对国内国际参赛团队的项目商业策划书和答辩PPT进行网上集中评审。

评审结束后,根据项目得分情况评出进入复赛的名单并及时公布结果。

2.复赛评选(2025年4月下旬)

由各赛道承办高校组织专家评审。国内参赛项目团队线下集中答辩,评委现场评审,地点为各赛道承办高校;国际参赛项目团队可以申请线上答辩,集中线上评审。

评审结束后,根据项目得分情况评出进入总决赛的名单,经公示无异议后公布结果。

3.总决赛(2025年5月)

由大赛组委会组织。国内参赛项目团队线下集中答辩,评委现场评审;国际参赛项目团队可以申请线上答辩,集中线上评审。

评审结束后,根据项目得分情况评出获奖名单,经公示无异议后公布结果。

颁奖典礼(2025年5-6月)

由大赛组委会组织,择期举行。

奖项设置

大赛奖励及奖金

进入总决赛的项目按照六大赛道部分组别参加比赛,各赛道分别设置一等奖1名、二等奖2名、三等奖3名、优胜奖若干,颁发获奖证书、奖杯及奖金。

大赛设优秀指导教师奖、优秀组织奖。

大赛其他奖励政策

1.大赛总决赛一、二等奖获奖者将晋级“海聚英才”全球创新创业大赛复赛。

2.大赛总决赛获奖者可参加组委会举办的上海市创新创业研修班和创业 CEO 培训班,获得优先推荐进入“海聚英才”创业训练营、“创业谷”训练营、上海市留学人员创新创业研修营等学习机会。

3.大赛获奖项目可以优先推荐申请有关支持单位的基金或担保贷款,并享受相应利息补贴。

4.大赛参赛项目落地孵化,可享受市、区各科创孵化基地工商注册、财务、法律等服务。

5.大赛获奖项目将与各区内应用场景对接,提供企业宣传、市场拓展等创业服务资源。对符合条件的海内外人才,推荐申请上海市各区人才计划政策(详见附件5:黄浦区、金山区、长三角国家技术创新中心)。

大赛解释权

本通知所涉及内容的最终解释权归大赛组委会所有。

联系人及联系方式

联系人:刘老师,电话:021-64741228;

李老师,电话:021-55270023

工作时间:周一至周五

上午 9:00——11:00

下午 13:00——16:00

报名网站:https://hjyc.youkehulian.com

官方公众号:上海科创委

“AI创业项目仍在寻找市场的认可度”

·当前的创业赛道日益细分,对创业项目的评审要求也相应提高。在不同的应用场景中,AI的成熟度、客户的接受度和市场的认可度,还需要一个商业验证的过程。

随着生成式AI的兴起,越来越多人开始加入AI创业的大潮。然而,对于许多创业者来说,当前仍在寻找市场的认可度。

11月15日,2024年“创·在上海”(Startup in Shanghai)国际创新创业大赛进入复赛阶段。

此次大赛赛事分为产业高质量发展专业赛道和未来产业新赛道专题赛,其中产业赛道重点关注集成电路、生物医药、人工智能和科技研究和技术服务业等产业,设置新一代信息技术、高端装备制造、新能源、新材料、资源与环境和新能源汽车等多个细分赛道。

2024年“创·在上海”(Startup in Shanghai)国际创新创业大赛复赛现场

Techin科创界创始合伙人徐荣作为本次大赛的评委之一,在接受澎湃科技(www.thepaper.cn)采访时直言,当前的创业赛道日益细分,对创业项目的评审要求也相应提高。本次大赛中,多家企业展示了AI技术在资源环境等传统行业的创新应用,值得关注。

徐荣指出,通过AI技术可以构建更可控、可监测、可分析、可预测的模型,这是未来行业应用的发展趋势。“但在不同的应用场景中,AI的成熟度、客户的接受度和市场的认可度,还需要一个商业验证的过程。” 徐荣观察到,本次参赛的项目团队多由具备技术背景的创业者组成,成员年龄集中在30-40岁,这反映出当前许多创业项目的人才架构日趋成熟,项目更具市场导向性。

“没有技术支撑就没有竞争力”

进入复赛的杨若来自上海缤氛物联网科技有限公司,他的参赛项目是“AI驱动香氛嗅觉体验升级服务系统”。项目核心是利用AI智能算法确定香氛扩香的布点和设备选型。

“过去,我们需要派人到连锁酒店实地考察香氛布置点位,耗费大量时间和人力。”杨若介绍说,借助AI技术构建的大模型,客户只需输入平面图,就能精准知道需要在哪些位置安装设备。“这不仅降低了成本,还提高了准确性。”据悉,这个项目可以使客户在成本降低40%的基础上仍能保持40%的毛利率。

今年是杨若第三次参赛,他表示,当前创业技术支撑非常关键,有了核心技术的支撑,创业项目在与客户博弈时会有更大的议价空间;而没有技术创新,只能被市场压制。杨若想利用此次答辩机会,看项目能否通过评委初步的商业化验证。杨若坦言,当前很多AI领域创业者仍在寻找合适的应用场景,等待客户的认可和订单的落地。目前他们的产品主要依赖于大型连锁酒店等B端客户,如果通过评委初步的商业化验证,也会直接影响到公司是否选择进入ToC端市场。

来自上海博瑞思环境科技有限公司的吴杨(化名)作为企业代表,参赛项目是基于AI技术的多参数传感器融合水环境智慧管理无人船,主要用于水质监测、水面作业和应急维护等。

吴杨表示,利用AI技术开发的智慧管理无人船,可以替代传统人工进行水质监测和水面作业,降低劳动风险,提高工作效率。“我们通过积累大量的数据,建立水环境数据库,利用AI技术进行分析,可以更精准地进行水环境治理,提升治理效果。” 他认为,环境领域是一个跨学科的领域,未来的创业方向中,跨界融合AI技术将是大势所趋。此次参赛项目如果获得评委商业化验证,将首先在公司内部进行商业化推广,随后拓展ToB端市场。

人才架构成熟度越来越高

作为评委,徐荣更关注企业能否聚焦于解决客户的实际问题,尤其是能否利用技术创新解决客户的痛点。“能否得到市场的验证,有没有客户愿意为你的技术买单,是企业的立命之本。” 

据悉,本年度大赛小微企业组评选结果与创新资金政策对接,大赛成长企业组评选结果与科技小巨人工程政策对接。获奖企业还可获得大赛提供的“创孵学院”培训、“梦想沙龙”服务、优先推荐科创助力贷等支持。

作为此次复赛分赛点之一,复旦大学科技园总经理荆勇表示,希望借助大赛的平台,发掘有潜力的创业项目入驻园区。荆勇称,今年创业项目相较于过往有所减少,但质量明显提升,此外,创业项目更聚焦于垂直应用领域,技术驱动为主要特色。园区希望通过“以赛促创、以创促企、以企促产”的方式,帮助创业项目从概念走向市场。

荆勇介绍,复旦大学科技园会为在大赛中脱颖而出的项目提供免租办公空间、创业导师辅导、产业资源对接等支持,帮助他们渡过初创阶段的难关。