AI学术圆桌派

作者

August

读者

内容

全部文章

August

2023/12/17

哀悼！55岁商汤科技创始人汤晓鸥突然离世；ChatGPT入选《Nature》年度十大人物 | AI资讯日报

【1分钟速看版】

🤯1.英特尔联袂百川智能酷睿Ultra跑上Baichuan 2

🌌2.通义千问大模型，将跑在 AI PC 上，没网也能玩

🐧3.工信部：今年我国语言大模型市场增长率将超 100%，拥有超过 19 个研发厂商

✍️4.字节跳动被曝秘密使用 OpenAI 技术、账户被暂停，三方回应

🎬5.哀悼！55岁商汤科技创始人汤晓鸥突然离世，他撑起中国计算机视觉研究半壁江山

🧑‍🏫6.腾讯联手西安交大、香港大学，发布多模态大模型VL-GPT

✨7.ChatGPT入选《Nature》年度十大人物

🤯8.加速AI落地，英特尔携手合作伙伴推动AIGC数智人才培养

⚡️9.UC 伯克利发现 GPT-4 惊人缺陷：儿童从经验中学习因果，LLM 却不行

‍🧑‍🏫10.消息称谷歌 Pixel 9 系列手机将内置全新的专属 AI 助手“Pixie”

🔬11.Mozilla 公布 MemoryCache 项目，利用浏览器历史记录训练设备端 AI

‍🎬12.可令 AI 模型计算复杂离散数学问题，谷歌 DeepMind 公布“FunSearch”训练法

国内资讯

1. 英特尔联袂百川智能酷睿Ultra跑上Baichuan 2

百川智能联合创始人、联席总裁洪涛表示，百川智能与英特尔合作，对模型在端侧进行进一步优化，使得百川大模型在酷睿Ultra的平台上良好运行。未来，百川智能将与英特尔持续探索大语言模型在端侧计算和AIGC领域的应用和发展。

酷睿Ultra携更多软硬件特性到来，底层的硬件架构既可以是CPU、GPU、VPU、FPGA，也可以是全新的NPU，甚至是更多的其他针对不同应用的硬件加速器。这些加速器可为包括百川在内的大模型提供直接的硬件推理能力，从而使更多模型的推理工作转移到PC平台，实现高效、安全的本地化运行。此前，英特尔已经宣布其酷睿产品可运行60亿参数的大模型，酷睿Ultra与百川大模型的组合，将进一步提升模型规模和运行效率。

2. 通义千问大模型，将跑在 AI PC 上，没网也能玩

在 12 月 15 日的英特尔 AI 主题活动上，我们看到了阿里云通义千问大模型成功适配英特尔酷睿 Ultra 平台，未来可在 PC 等端侧部署。

得益于第一代酷睿 Ultra 平台 Meteor Lake 有着英特尔 40 年来最重大的处理器架构变革，即分离式模块架构，以及首次集成神经网络处理单元（NPU），部署在英特尔酷睿 Ultra 平台设备上的通义千问大模型能够大幅缩短模型推理响应时间，平均加速可达 3 倍。

3. 工信部：今年我国语言大模型市场增长率将超 100%，拥有超过 19 个研发厂商

据央视新闻报道，工业和信息化部赛迪研究院数据显示，今年我国语言大模型市场规模实现较快提升，应用场景不断丰富，增长率有望突破 100%。

报道称，目前我国已有超过 19 个语言大模型研发厂商，其中通过备案的共有 15 家厂商的模型产品，预计今年我国语言大模型市场规模将达到 132.3 亿元，增长率将为 110%。

据央视新闻介绍，语言大模型能够模仿人类的对话和决策能力，是率先实现技术突破和应用落地的大模型，也是当下人工智能的“主赛道”。目前，语言大模型在金融、医疗、教育、工业、游戏、法律等多个行业得到了广泛的应用。

4. 字节跳动被曝秘密使用 OpenAI 技术、账户被暂停，三方回应

据外媒报道，在生成式 AI 竞争中处于落后的字节跳动想要“抄近道”，该公司一直在秘密使用 OpenAI 的技术开发自家大语言模型，这违反了 OpenAI 的服务条款。目前，字节跳动的账户已被 OpenAI 暂停。

5. 哀悼！55岁商汤科技创始人汤晓鸥突然离世，他撑起中国计算机视觉研究半壁江山

沉痛悼念！

2023年12月15日23时45分，商汤科技创始人汤晓鸥教授因病救治无效不幸离世，终年55岁。

天妒英才，继孙剑博士2年前意外辞世后，中国AI界再失一位领军人物。

6. 腾讯联手西安交大、香港大学，发布多模态大模型VL-GPT

Arxiv 页面显示，腾讯近日联手西安交通大学、香港大学共同发表论文，介绍了一款多模态大模型VL-GPT。

论文表示，VL-GPT是一种能够同时感知和生成视觉与语言数据的转换器模型。通过采用直接的自动回归目标，实现了图像和文本模式的统一预训练方法，从而使该模型能够像语言模型处理文本一样无缝地处理图像和文本。

研究显示，VL-GPT 在各种视觉和语言理解与生成任务（包括图像字幕、视觉问题解答、文本到图像生成等）中都表现出了卓越的性能。

海外资讯

7. ChatGPT入选《Nature》年度十大人物

《Nature》杂志15日公布了2023年十大人物名单，除了十位年度人物之外，ChatGPT也被《Nature》收入榜单。

对于ChatGPT，《Nature》给出的评价是，虽然ChatGPT不是人，然而在很多方面，这个程序在过去一年里对科学产生了深远而广泛的影响。

除了 ChatGPT 之外，月船 3 号项目副主管 Kalpana·Kalahasti、OpenAI 首席科学家、人工智能先驱 Ilya·Sutskever 等人也被《Nature》选为《Nature》年度十大人物。

8. 加速AI落地，英特尔携手合作伙伴推动AIGC数智人才培养

随着数字化向数智化的转型发展，如今，利用AI进行创作的AIGC行业也在快速兴起，针对当前AIGC在高校教学、科研上的需求，英特尔助力合作伙伴与诸多高校、合作伙伴等，建立了联合科研、人才培养、平台课程、竞赛挑战等广泛的学术合作资源，为AI人才培养提供全链路支持，建立起贴近实际项目的实训实践，加快推动产学研用的深度融合。联合伟世作为英特尔重要的合作伙伴，也在AI产学研用相关推广上做了很多努力。

9. UC 伯克利发现 GPT-4 惊人缺陷：儿童从经验中学习因果，LLM 却不行

最近 UC 伯克利的一篇论文却显示，LLM 和孩童相比，欠缺了一项很重要的能力。

那就是 —— 从经验中学习因果结构的能力。

当然了，研究人员们也并不是一点儿招没有，RLHF 在某种程度上可以解决这个问题。但是解决的逻辑，却和孩子们学习完全不同。

LeCun 也是转发了这篇研究，并配文「那些孩子们可以，LLM 却做不到的事。」

10. 消息称谷歌 Pixel 9 系列手机将内置全新的专属 AI 助手“Pixie”

综合 The Information、9to5Google 等外媒报道，谷歌正在开发一款全新的 AI 助手，它基于自家最新的 Gemini 模型，将是 Pixel 设备的专属助手，名为“Pixie”。

报道称，Pixie 将成为一个“更具个性化”的谷歌助手，其目标是执行复杂的多模态任务，使用 Pixel 系列手机上的 Gmail、地图和其他来自谷歌产品的数据。例如，向用户推荐离自己最近的商店。

11. Mozilla 公布 MemoryCache 项目，利用浏览器历史记录训练设备端 AI

Mozilla 15日推出一项名为 MemoryCache 的项目，号称能够“结合本地个人数据与 Firefox 火狐浏览器存储的数据”，帮助开发者强化设备端 AI 模型，提供“个性化体验”。

12. 可令 AI 模型计算复杂离散数学问题，谷歌 DeepMind 公布“FunSearch”训练法

谷歌 DeepMind 日前公布了一种名为“FunSearch”的模型训练法，号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。

References

[1]https://www.pingwest.com/w/291047

[2]https://36kr.com/p/2556057419635079

[3]https://www.ithome.com/0/739/639.htm

[4]https://m.163.com/dy/article/IM5OQNJB0001899O.html

[5]https://www.51cto.com/article/776777.html

[6]https://arxiv.org/pdf/2312.09251.pdf

[7]https://36kr.com/p/2560484942568583

[8]https://www.pingwest.com/w/291049

[9]https://www.ithome.com/0/739/774.htm

[10]https://www.ithome.com/0/739/626.htm

[11]https://www.mozilla.org/en-US/?v=1

[12]https://www.ithome.com/0/739/522.htm

August

2023/12/12

2023年度关于人工智能AI必看五本书！

相关专业的大学生或者研究生，以及想快速补充各种有关人工智能历史进程以及未来趋势的同学，均适合阅读。

1.《AI 3.0》[美]梅拉妮.米歇尔

豆瓣评分：8.4

AI科普+发展史，简要介绍了人工智能领域中许多重大研究课题

2.《千脑智能》[美]杰夫.霍金斯

豆瓣评分：8.2

千脑智能理论

3.《机器学习》周志华

豆瓣评分：8.6

算法是“死”的，思想才是"活"的

4.《智慧的疆界》周志明

豆瓣评分：9.4

人工智能技术发展史，最好的人工智能科普

5.《深度学习》[美]伊恩.古德费洛

豆瓣评分：8.4

深度学习领域的经典教材

百度网盘链接: https://pan.baidu.com/s/197e990qcPB6uOn0edAaFIQ?pwd=es6s

提取码: es6s

August

2023/12/12

OpenAI宣布近期修复GPT-4“变懒”问题，将在离线评估及A/B测试后更新模型 | AI资讯日报

【1分钟速看版】

🤯1.荣耀申请荣耀魔方大模型商标，MagicOS 或将融合端侧 AI 大模型

🌌2.零一万物Yi-34B-Chat微调模型上线，登陆多个权威榜单

🐧3.通义千问登顶OpenCompass开源基模评测榜

✍️4.高德地图车道级导航已支持国内 99% 以上城市和乡镇道路，基于北斗和 AI 模型

🎬5.夸张！EMNLP投稿近5000篇，奖项出炉：北大、腾讯摘最佳长论文

🧑‍🏫6.像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

✨7.微软与美国最大工会组织建立合作关系，挖掘 AI 对工人的正面作用

🤯8.OpenAI 宣布近期修复 GPT-4“变懒”问题，将在离线评估及 A / B 测试后更新模型

⚡️9.马斯克的 AI 聊天机器人 Grok 出现“幻觉”，误认为自己是 OpenAI 的产品

‍🧑‍🏫10.微软必应生成图片默认存储 50 天，后续要延长至 90 天

🔬11.Runway官宣下场通用世界模型！解决视频AI最大难题，竟靠AI模拟世界？

‍🎬12.Meta 公布 PathFinder ，基于树搜索的推理路径生成方法

国内资讯

1. 荣耀申请荣耀魔方大模型商标，MagicOS 或将融合端侧 AI 大模型

据天眼查APP显示，近日，荣耀终端有限公司申请注册“荣耀魔方大模型”商标，国际分类为网站服务，当前商标状态为等待实质审查。

此前，该公司曾申请两枚“MAGIC 大模型”商标。而不久之前，荣耀CEO赵明发文称，荣耀即将推出自研端侧AI大模型和全新云服务。

2. 零一万物Yi-34B-Chat微调模型上线，登陆多个权威榜单

继 11 月初零一万物发布 Yi-34B 基座模型后，Yi-34B-Chat 微调模型在 11 月 24 日开源上线，短时间登陆了全球多个英文、中文大模型权威榜单，再度获得了全球开发者的关注。

其中，在斯坦福大学提出的大语言模型评测基准 AlpacaEval 上，Yi-34B-Chat 以 94.08% 的胜率，超越 LLaMA2 Chat 70B、Claude 2、ChatGPT，在 Alpaca 经认证的模型类别中，成为业内仅次于 GPT-4 英语能力的大语言模型，并且是经由 Alpaca 官方认证为数不多的开源模型。

3. 通义千问登顶OpenCompass开源基模评测榜

中国权威的大模型评测平台OpenCompass日前更新了榜单，阿里云通义千问72B模型登上开源基座大模型榜首。

OpenCompass是上海人工智能实验室开源的大模型评测平台，涵盖学科、语言、知识、理解、推理等五大评测维度，可全面评估大模型能力。在最新的OpenCompass开源基座大模型榜单上，通义千问72B模型以67.1的综合得分夺冠。此前，通义千问还曾力压Llama2登顶全球最具权威性的HuggingFace开源大模型排行榜。

4. 高德地图车道级导航已支持国内 99% 以上城市和乡镇道路，基于北斗和 AI 模型

高德地图近日宣布旗下基于北斗卫星导航系统、深度学习模型、惯性导航、泛在信号等前沿技术研发的车道级导航服务，截至目前已支持在国内 99% 以上的城市和乡镇道路使用。这也是截至目前，全球范围内覆盖规模最大的车道级导航服务。

据介绍，该功能搭载高德自研深度学习模型，可以实现全路网融合的 3D 自动化建模，批量化、规模化地实现楼宇道路、自然环境、城市地标等元素在高德地图中的全自动化三维映射。如今随着车道级导航基本完成了全国道路的覆盖，高德应用 AI 自动化建模技术，构建完成全球规模最大数字化地图。

5. 夸张！EMNLP投稿近5000篇，奖项出炉：北大、腾讯摘最佳长论文

EMNLP 是自然语言处理领域的顶级会议之一，EMNLP 2023 于 12 月 6 日 - 10 日在新加坡举行。

因为今年 ChatGPT 的爆火带动大模型、NLP 概念，EMNLP 2023 的投稿论文数量也达到近 5000 篇，甚至略高于 ACL 2023。

EMNLP 2023 颁发了最佳长论文、最佳短论文、最佳主题论文、最佳 Demo 论文和最佳行业论文各一篇，以及多篇不同赛道的杰出论文。

同时，官方公布了 EMNLP 2024 将于 2024 年 11 月 12-16 日、佛罗里达州迈阿密市举办。

6. 像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地，「模型治理」已经成为了目前受到重点关注的命题。只不过，在实践中，研究者往往感受到多重挑战。

一方面，为了高其在目标任务的性能表现，研究者会收集和构建目标任务数据集并对大语言模型（LLM）进行微调，但这种方式通常会导致除目标任务以外的一般任务的性能明显下降，损害 LLM 原本具备的通用能力。

另一方面，开源社区的模型逐渐增多，大模型开发者也可能在多次训练中累计了越来越多的模型，每个模型都具有各自的优势，如何选择合适的模型执行任务或进一步微调反而成为一个问题。

近日，智源研究院信息检索与知识计算组发布 LM-Cocktail 模型治理策略，旨在为大模型开发者提供一个低成本持续提升模型性能的方式：通过少量样例计算融合权重，借助模型融合技术融合微调模型和原模型的优势，实现「模型资源」的高效利用。

海外资讯

7. 微软与美国最大工会组织建立合作关系，挖掘 AI 对工人的正面作用

据微软官方消息，微软和美国劳工联合会和工业组织大会宣布达成合作伙伴关系，以开展公开对话，讨论人工智能（AI）如何预测工人的需求，并将工人的声音纳入其开发和实施过程中。

据悉，这是劳工组织与科技公司之间首次以人工智能为主题的合作，将实现三个目标： (1) 与工会领袖和工人分享有关人工智能技术趋势的深度信息；(2) 将工人的观点和专业知识纳入人工智能技术的开发；(3) 帮助制定支持一线工人技术技能和需求的公共政策。

微软表示，将会从2024年冬季开始推出学习课程，提供有关 AI 工作原理和发展方向的信息，概述其机遇并分析潜在挑战。劳工领袖和工人可以在线访问这些按需提供的数字资源。此外，从 2024 年到 2026 年，他们还将举办针对特定职业和角色的深度挖掘和体验式研讨会。

8. OpenAI 宣布近期修复 GPT-4“变懒”问题，将在离线评估及 A / B 测试后更新模型

OpenAI 近日表示，将会在近期针对模型“变懒”的问题进行修复，不过需要等到完成线上测试和离线评估之后才可以更新。

OpenAI 表示，他们将在彻底的离线评估和线上 A / B 测试后尽快更新 GPT-4 模型，同时也鼓励用户积极对模型表现进行回馈。

此前曾有用户表示，ChatGPT出现变懒的问题，在用户提问之后，机器人并不会回答完整的问题，而只是给出部分回答，之后再引导用户自己写出剩余的答案。

9. 马斯克的 AI 聊天机器人 Grok 出现“幻觉”，误认为自己是 OpenAI 的产品

近日，埃隆・马斯克旗下 AI 公司 xAI 推出了全新的人工智能聊天机器人 Grok，并面向美国地区的 Premium+ X 用户开放。据官方介绍，Grok 采用了名为 Grok-1 的模型，与目前 OpenAI 旗下 ChatGPT 所使用的 GPT-4 模型完全不同。值得一提的是，Grok 还整合了 X 平台的实时数据，能够根据 X 平台的最新动态提供实时回应，这也是其与其他竞争对手的显著差异之一。

然而，就像所有 AI 聊天机器人一样，Grok 也存在“幻觉”问题，即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型（LLM）中都普遍存在，包括 ChatGPT。

近日，一个 Grok 尴尬的“幻觉”在社交媒体上引起热议。有用户在使用 Grok 时收到回应称：“我无法完成您的请求，因为它违反了 OpenAI 的用例政策。”