AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；ChatGPT Plus会员可上传和分析文件；谷歌Bard支持实时生成回复

2023-10-30 15:32 · 稿源：站长之家

🤖📈💻💡大模型动态

百川智能发布Baichuan2-192K大模型，可处理35万汉字

百川智能发布了Baichuan2-192K大模型，拥有全球最长的上下文窗口，处理约35万个汉字，超越了Claude2。

百川大模型官网:https://top.aibase.com/tool/baichuandamoxing

【AiBase提要】
🚀 Baichuan2-192K大模型发布，处理长文本、问答等多项任务。
📊 超越Claude2，上下文窗口长度超过4.4倍。
🌐 内测中，合作伙伴包括法律、媒体、金融等领域，全面开放不久。

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，提供超大规模中文数据集，包括两个模型，以支持大模型的商用应用和降低商业门槛。

【AiBase提要】
📚 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。
🌐 提供超大规模的高质量中文数据集，包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。
💼 大模型即将全面开放商用，为应用和开源社区发展提供技术支持，降低商业门槛。

📰🤖📢AI新鲜事

DALL·E3更新，新增种子功能允许用户精修生成图片

OpenAI悄悄更新了DALL·E3，增加了一种种子功能，允许用户精细编辑生成的图像，包括添加元素、改变视角和调整光线和颜色。

【AiBase提要:】
🌱 OpenAI推出DALL·E3的新种子功能，用户可以通过特定种子修改生成的图像。
🎨 用户可以在生成的图像中添加元素、更改颜色等操作，类似于Photoshop。
🚀 这一功能似乎是最近才更新的，展示了OpenAI不断努力改进DALL·E3的愿望。

ChatGPT Plus会员可上传和分析文件，实现多模态支持

ChatGPT Plus会员在最新测试版中可上传和分析文件，不再需要手动切换模式，同时引入多模态支持，提供更多应用场景。

【AiBase提要:】
📌 ChatGPT Plus会员无需手动模式切换，可以上传和分析文件。
📌 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。
📌 ChatGPT不仅限于文本文件，还可以处理多媒体内容，如图片生成。

谷歌Bard升级，实时生成回复不用等待

谷歌的聊天机器人Bard升级，提供更快速的实时回复选项，改进了用户的互动体验，同时允许用户自定义回答风格。

【AiBase提要:】
🚀 谷歌Bard升级，提供更快速的实时回复选项，减少用户等待时间。
🔁 用户可以选择实时回答或完成后回答的选项，提高互动体验。
🖋️ 用户还可以自定义回答风格，使Bard的回复更符合他们的口味。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告，外星生命可能是高度智能的AI，而非有机生命，这与人工智能时代的来临有关。

【AiBase提要】
🚀 英国皇家天文学家警告，外星生命可能比预期更智能。
🤖 外星生命可能是非有机智能，与宇宙中缺乏与人类相似生命有关。
🌌 探测AI外星生命可能困难，因为它们可能不依赖达尔文选择进化。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌投资20亿美元巩固在人工智能领域的地位，与Anthropic建立战略伙伴关系，加速AI创新，竞争激烈，亚马逊等巨头也重大投资。

【AiBase提要:】
💰 谷歌向Anthropic投资20亿美元，强化在人工智能领域的地位，推动行业变革。
🤝 谷歌的投资不仅是财务支持，还是战略合作，旨在加速Anthropic的人工智能创新，同时增强Google Cloud在AI领域的地位。
🌟 亚马逊也对Anthropic进行40亿美元的重大投资，加剧人工智能领域的竞争，科技巨头竞相投资以确保领先地位。

🤖📱💼AI应用

阿里云通义千问APP上线，支持创意文案等功能

阿里云旗下通义千问APP正式上线，提供创意文案、办公助理、学习助手和趣味生活等多种核心功能。

AiBase提要:
1. 🚀 阿里云通义千问APP正式上线，拥有多种核心功能，包括文案创作、办公助理、学习助手和趣味生活支持。
2. 📅 该APP中的通义千问大模型已通过备案，允许广大用户登录官网进行体验。
3. 🌐 阿里云的通义千问APP将帮助用户更智能、更便捷地满足多方面需求，包括文案创作、学习助手等。

图库巨头Getty Images拥抱AI技术推出生成式AI服务

Getty Images采取双重策略，起诉侵权AI图像生成公司，并推出名为“Generative AI”的新服务，以为商业客户提供AI图像生成，避免知识产权风险。

【AiBase提要:】
📸 Getty Images采取法律行动起诉侵权AI图像生成公司，捍卫知识产权。
🔧 推出“Generative AI”服务，与Nvidia合作，为商业客户提供商业可行的AI图像生成，避免知识产权风险。
📷 AI生成的内容不会被添加到Getty Images的图像库，以保持图像库的权威性和可信度。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用，通过沉浸式3D预览展示产品，提供互动购物体验，利用现代技术如three.js、react-three-fiber、expo-gl等，使用户能旋转、缩放和平移3D模型，提升在线购物的互动性。

QQ截图20231030115635.jpg

项目地址:https://github.com/alexandrius/react-native_3d_store

【AiBase提要:】
😎 React Native3d Store是一先进的React Native应用，提供沉浸式3D产品预览和互动购物体验。
😎 应用采用现代技术，包括three.js、react-three-fiber，使3D模型更逼真，用户可探索产品细节。
😎 兼容最新Expo版本，致力于提供最佳的3D购物体验，彻底改变了在线购物方式。

GPT Pilot:AI驱动的开发工具，可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具，能从开发人员提供的应用描述中生成可扩展的应用程序代码，支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

项目地址:https://github.com/Pythagora-io/gpt-pilot

【AiBase提要:】
🤖 GPT Pilot是AI驱动的开发工具，能根据应用描述生成应用程序代码。
🤖 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码，实现高效开发。
🤖 GPT Pilot支持任务持续迭代和修复，促进开发者与AI的合作，代表未来应用开发的新方向。

👨‍💻💡🎯聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型，通过训练450万实例，实现了人体全身姿态与体型估计，同时能捕捉身体和面部动作，对数据缩放和模型缩放进行了探索，在学术数据集上表现出强大性能。

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

【AiBase提要:】
1. 首次提出了动捕大模型SMPLer-X，用来进行人体全身姿态与体型估计，成功刷新了七个关键榜单。
2. SMPLer-X不仅能够捕捉身体动作，还可以输出面部和手部动作，并估计体型。
3. 研究探索了数据缩放与模型缩放，对32个学术数据集进行排名，展示了在各种测试和榜单中的强大性能。

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型，解决了地理信息和语义知识融合问题，实现了引用和定位图像中元素的能力，性能优于传统模型。

AiBase提要:
1. 苹果的Ferret模型解决了地理信息和语义知识融合问题，使其能够引用和定位图像元素。
2. Ferret采用多模态大语言模型（MLLM），处理自由文本和引用区域，性能优于传统模型。
3. 研究人员创建了GRIT数据集，评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能，性能平均优于其他MLLM模型20.4%。

Monarch Mixer（M2）:比Transformer更低成本的模型架构

Monarch Mixer（M2）是一种新的模型架构，通过采用Monarch矩阵替代传统Transformer的注意力和MLP，实现更低成本取得更优的性能，挑战了传统Transformer的优越性。

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

【AiBase提要】
🌟 Monarch Mixer（M2）采用Monarch矩阵替代注意力和MLP，降低了成本，在多任务上媲美传统Transformer。
🌟 具备次二次复杂度，处理更长序列和高维度表征，同时保持计算效率。
🌟 M2不仅节省参数，还具有更高的硬件效率，是潜在的传统Transformer替代选择。

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架，可降低多模态大模型的“幻觉”问题，提高准确性，无需重训，为解决大模型问题提供了新方法。

项目地址:https://github.com/BradyFU/Woodpecker

【AiBase提要:】
😎 “啄木鸟”框架是一种免重训、即插即用的通用架构，通过诊断并纠正多模态大模型的“幻觉”问题，提高准确性。
😎 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成，以及幻觉纠正，无需特定数据微调或重新训练模型。
😎 在实验中，“啄木鸟”成功降低了多模态大模型的“幻觉”，提高了答案的准确性，为解决大模型问题提供了有效工具。

（举报）

相关推荐
大家在看

关键词：

百川

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
音乐ChatGPT时刻来临！「天工SkyMusic」音乐大模型今日启动邀测

4月2日，昆仑万维AI音乐生成大模型「天工SkyMusic」即日起面向社会开启免费邀测。昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”，成为AI行业全新里程碑。未申请邀测的用户也可在4月17日免费下载最新版“天工AI智能助手”APP，感受「天工3.0」与「SkyMusic」带来的颠覆性AI体验。

AI音乐生成大模型昆仑万维
荐今日AI：ChatGPT免注册可使用；开发者没法“白嫖”Gemini了；AI程序员首次入职科技公司；DALL·E聊天就能改图了

欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

ChatGPT
OpenAI图像生成器DALL-E2停止服务，DALL-E3接替其位置

OpenAI宣布关闭DALL-E2图像生成器服务，由其后续产品DALL-E3替代。DALL-E2在2022年4月面世后不久，以其能够根据简单文本提示生成高质量图像一举成名。但为了安全起见，大家可能需要下载自己特别喜欢的任何内容。

OpenAI DALL-E2 DALL-E3
Nothing 宣布其耳机将支持 ChatGPT

Nothing近日宣布，计划将ChatGPT与其智能手机和耳机更深度整合。此举将为公司的客户提供更快速的服务。该博客文章表示:“Nothing还将通过在NothingOS中嵌入系统级入口点到ChatGPT，包括截屏共享和Nothing风格的小部件，改善Nothing智能手机用户体验。

ChatGPT Nothing AI头条
微信发布桌面效率AI工具小微助手支持类ChatGPT在线聊天问答功能

微信最近发布了一款名为“小微助手”的桌面AI效率工具，旨在通过自然语言处理技术，提升用户在电脑上的工作效率。这款工具不仅支持Windows和Mac操作系统具备以下特点:搜索功能:小微助手提供了高度灵活的搜索功能，允许用户通过自然语言搜索电脑中指定文件夹的所有内容。对话窗口支持基本编辑操作，并可以独立成为一个单独的窗口，支持会话列表的管理。

小微助手 AI头条
OpenAI新GPT-4 Turbo模型上线：可供付费ChatGPT用户使用

OpenAI的全新GPT-4Turbo模型已全面上线，并正式向付费ChatGPT用户开放。GPT-4Turbo更新标志着人工智能领域的又一重要进步，为用户提供了更强大、更高效的文本处理、数学计算、逻辑推理以及编码能力。GPT-5预计将在今年夏季推出，有望在性能、功能和应用场景等方面实现更大的突破和创新。

OpenAI GPT-4 Turbo
ChatGPT无需注册即可使用但部分功能或将受限

人工智能领域的领军初创企业OpenAI宣布，从即日起，用户无需繁琐的注册流程，即可直接体验ChatGPT的强大功能。这一变革旨在让更多人轻松领略人工智能的魅力，推动其普及和应用。用户无法享受一些高级特性，如保存或分享聊天记录、使用个性化指令等，这些功能通常需要与用户的永久账号绑定。

人工智能 OpenAI ChatGPT
荐今天起，ChatGPT无需注册就能用了！

OpenAI狠狠地open了一把:像这样，直接登录网站，然后就可以开启对话:OpenAI对发布这个“超自由版ChatGPT”的解释是:不过面对OpenAI突如其来的open，很多网友还是觉得难以置信:但OpenAI这一次，是真没开玩笑。超自由版ChatGPT对于这个“超自由版ChatGPT”，需要强调是开放的只有3.5版本，GPT-4的使用还是老方法。奥特曼交出基金控制权，可能就是加速主义的妥协，毕竟内讧事件中，加速

ChatGPT
免费用户也可创建GPTs了？ChatGPT 即将更新功能曝光 GPT plus不香了！

博主TiborBlaho在推特上披露了ChatGPT即将推出的新功能和改进，尽管关于GPT-5的具体信息尚未公开，但OpenAI显然已经在为ChatGPT的下一步发展做准备。新版用户界面:界面将进行优化，部分元素将被隐藏或重新设计。小部件功能，包括天气、计算器、体育、财经、时区差异等。

GPTs ChatGPT AI头条
OpenAI允许用户直接使用ChatGPT：无需注册账号

当地时间4月1日，知名人工智能公司OpenAI发布重要公告，宣布将允许用户无需注册即可直接使用ChatGPT，这一举措旨在让更多人能够轻松体验人工智能的魅力。值得注意的是，对于未注册的用户，某些高级功能如保存或分享聊天记录、使用个性化指令等将无法享受。这一举措既体现了OpenAI对于技术进步的追求，也充分尊重了用户的个人意愿和权益。

人工智能 OpenAI ChatGPT

Nextminds:是一家提供在线辅导服务的平台，为所有科目和学术水平的学生提供个性化辅导。

Nextminds是一个提供在线辅导服务的平台，通过与经验丰富的导师在线互动，为学生提供个性化的学习经验。平台提供ICSE、CBSE和州委员会等多种教育体系的辅导。Nextminds的主要优点是学生可以在舒适的家中与专业的导师进行一对一的在线学习，为学生提供高质量的辅导服务。

在线辅导学习个性化

Pedagogue.io:每天花费10分钟，提升您的AI技能。

Pedagogue是一款AI技能培训平台，旨在帮助个人和企业提升AI技能。通过该平台，用户可以学习AI工具、技术和策略，并获得40%的生产力提升。Pedagogue的优势在于更新及时的内容库、个性化的技能培养、有趣的学习方式以及具有商业价值的数据驱动洞察。

AI 技能培训教育

LexiGym:你的语言学习伴侣。🚀 # #HinkouLabs

LexiGym是一款语言学习应用，帮助用户提升语言技能。它具有离线和多语言支持的创新功能，是最强大的语言学习伴侣。用户可以根据自己的预算选择免费使用或付费订阅，灵活选择学习方式。LexiGym还提供易于创建字典和智能学习等功能，以及详细的训练统计数据。

语言学习词汇训练多语言

Alevels.ai:A Levels AI是一个利用人工智能提高A Levels学习成绩的工具。

A Levels AI利用人工智能技术，提供个性化的学习计划和辅导资源，帮助学生在A Levels考试中取得优异成绩。它通过分析学生的学习情况和弱点，为其提供针对性的学习建议和练习题。A Levels AI还提供实时答疑和学习进度跟踪功能，帮助学生更好地掌握知识。

教育考试辅导人工智能

MailReply:是一款AI助手，可生成专业且人性化的邮件回复，节省时间。

MailReply通过AI生成邮件回复，帮助用户节省时间。它可以在保持人类写作风格的同时，根据邮件内容生成上下文相关的回复。MailReply适用于Windows和macOS，并兼容多种邮件客户端。

邮件回复 AI助手工具

Notification harbor:高性能团队的电子邮件营销平台

Notification harbor是一个为电子邮件营销团队提供AI优化的电子邮件内容和自动化流程的平台。通过使用LLM技术，我们可以在短短5分钟内创建高性能的电子邮件营销内容，并且随着时间的推移，产品甚至可以自我优化。我们的平台简化了电子邮件营销活动的方式，确保每个活动都能精准地与您的目标受众建立联系。AI生成的电子邮件模板根据您提供的信息和要求选择最合适的模板。实时个性化电子邮件可以提高用户参与度和转化率，并根据每个用户实时定制内容。AI驱动的电子邮件营销使您的团队在创建电子邮件模板和文本方面节省了60％的时间。

AI视野：百川发布Baichuan2-192K大模型；DALL·E3新增种子功能；ChatGPT Plus会员可上传和分析文件；谷歌Bard支持实时生成回复

今日大家都在搜的词：

热文

站长商机