首页 > 业界 > 关键词  > 百川最新资讯  > 正文

AI视野:百川发布Baichuan2-192K大模型;DALL·E3新增种子功能;ChatGPT Plus会员可上传和分析文件;谷歌Bard支持实时生成回复

2023-10-30 15:32 · 稿源:站长之家

🤖📈💻💡大模型动态

百川智能发布Baichuan2-192K大模型,可处理35万汉字

百川智能发布了Baichuan2-192K大模型,拥有全球最长的上下文窗口,处理约35万个汉字,超越了Claude2。

百川大模型官网:https://top.aibase.com/tool/baichuandamoxing

【AiBase提要】

🚀 Baichuan2-192K大模型发布,处理长文本、问答等多项任务。

📊 超越Claude2,上下文窗口长度超过4.4倍。

🌐 内测中,合作伙伴包括法律、媒体、金融等领域,全面开放不久。

昆仑万维开源百亿级大语言模型「天工」Skywork-13B 系列

昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,提供超大规模中文数据集,包括两个模型,以支持大模型的商用应用和降低商业门槛。

【AiBase提要】

📚 昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列。

🌐 提供超大规模的高质量中文数据集,包括两个模型: Skywork-13B-Base 和 Skywork-13B-Math。

💼 大模型即将全面开放商用,为应用和开源社区发展提供技术支持,降低商业门槛。

📰🤖📢AI新鲜事

DALL·E3更新,新增种子功能允许用户精修生成图片

OpenAI悄悄更新了DALL·E3,增加了一种种子功能,允许用户精细编辑生成的图像,包括添加元素、改变视角和调整光线和颜色。

image.png

【AiBase提要:】

🌱 OpenAI推出DALL·E3的新种子功能,用户可以通过特定种子修改生成的图像。

🎨 用户可以在生成的图像中添加元素、更改颜色等操作,类似于Photoshop。

🚀 这一功能似乎是最近才更新的,展示了OpenAI不断努力改进DALL·E3的愿望。

ChatGPT Plus会员可上传和分析文件,实现多模态支持

ChatGPT Plus会员在最新测试版中可上传和分析文件,不再需要手动切换模式,同时引入多模态支持,提供更多应用场景。

【AiBase提要:】

📌 ChatGPT Plus会员无需手动模式切换,可以上传和分析文件。

📌 新功能将ChatGPT Enterprise计划的办公功能引入了独立的个人聊天机器人订阅。

📌 ChatGPT不仅限于文本文件,还可以处理多媒体内容,如图片生成。

谷歌Bard升级,实时生成回复不用等待

谷歌的聊天机器人Bard升级,提供更快速的实时回复选项,改进了用户的互动体验,同时允许用户自定义回答风格。

【AiBase提要:】

🚀 谷歌Bard升级,提供更快速的实时回复选项,减少用户等待时间。

🔁 用户可以选择实时回答或完成后回答的选项,提高互动体验。

🖋️ 用户还可以自定义回答风格,使Bard的回复更符合他们的口味。

英国皇家天文学家称外星生命可能是超级智能AI

英国的皇家天文学家警告,外星生命可能是高度智能的AI,而非有机生命,这与人工智能时代的来临有关。

【AiBase提要】

🚀 英国皇家天文学家警告,外星生命可能比预期更智能。

🤖 外星生命可能是非有机智能,与宇宙中缺乏与人类相似生命有关。

🌌 探测AI外星生命可能困难,因为它们可能不依赖达尔文选择进化。

谷歌向AI初创公司Anthropic投资20亿美元

谷歌投资20亿美元巩固在人工智能领域的地位,与Anthropic建立战略伙伴关系,加速AI创新,竞争激烈,亚马逊等巨头也重大投资。

【AiBase提要:】

💰 谷歌向Anthropic投资20亿美元,强化在人工智能领域的地位,推动行业变革。

🤝 谷歌的投资不仅是财务支持,还是战略合作,旨在加速Anthropic的人工智能创新,同时增强Google Cloud在AI领域的地位。

🌟 亚马逊也对Anthropic进行40亿美元的重大投资,加剧人工智能领域的竞争,科技巨头竞相投资以确保领先地位。

🤖📱💼AI应用

阿里云通义千问APP上线,支持创意文案等功能

阿里云旗下通义千问APP正式上线,提供创意文案、办公助理、学习助手和趣味生活等多种核心功能。

AiBase提要:

1. 🚀 阿里云通义千问APP正式上线,拥有多种核心功能,包括文案创作、办公助理、学习助手和趣味生活支持。

2. 📅 该APP中的通义千问大模型已通过备案,允许广大用户登录官网进行体验。

3. 🌐 阿里云的通义千问APP将帮助用户更智能、更便捷地满足多方面需求,包括文案创作、学习助手等。

图库巨头Getty Images拥抱AI技术 推出生成式AI服务

Getty Images采取双重策略,起诉侵权AI图像生成公司,并推出名为“Generative AI”的新服务,以为商业客户提供AI图像生成,避免知识产权风险。

【AiBase提要:】

📸 Getty Images采取法律行动起诉侵权AI图像生成公司,捍卫知识产权。

🔧 推出“Generative AI”服务,与Nvidia合作,为商业客户提供商业可行的AI图像生成,避免知识产权风险。

📷 AI生成的内容不会被添加到Getty Images的图像库,以保持图像库的权威性和可信度。

3D产品预览应用React Native3d Store 线上购物更立体了

React Native3d Store是一款先进的React Native应用,通过沉浸式3D预览展示产品,提供互动购物体验,利用现代技术如three.js、react-three-fiber、expo-gl等,使用户能旋转、缩放和平移3D模型,提升在线购物的互动性。

QQ截图20231030115635.jpg

项目地址:https://github.com/alexandrius/react-native_3d_store

【AiBase提要:】

😎 React Native3d Store是一先进的React Native应用,提供沉浸式3D产品预览和互动购物体验。

😎 应用采用现代技术,包括three.js、react-three-fiber,使3D模型更逼真,用户可探索产品细节。

😎 兼容最新Expo版本,致力于提供最佳的3D购物体验,彻底改变了在线购物方式。

GPT Pilot:AI驱动的开发工具,可从零开始编写可扩展的应用程序

GPT Pilot是一款AI驱动的工具,能从开发人员提供的应用描述中生成可扩展的应用程序代码,支持需求澄清、技术选择、任务拆解、代码实现以及持续审核与修复。

image.png

项目地址:https://github.com/Pythagora-io/gpt-pilot

【AiBase提要:】

🤖 GPT Pilot是AI驱动的开发工具,能根据应用描述生成应用程序代码。

🤖 它协助开发者明确应用需求、选择技术栈、拆解任务、生成代码,实现高效开发。

🤖 GPT Pilot支持任务持续迭代和修复,促进开发者与AI的合作,代表未来应用开发的新方向。

👨‍💻💡🎯聚焦开发者

首个人体动捕基模型SMPLer-X面世

SMPLer-X是首个人体动捕基模型,通过训练450万实例,实现了人体全身姿态与体型估计,同时能捕捉身体和面部动作,对数据缩放和模型缩放进行了探索,在学术数据集上表现出强大性能。

image.png

项目地址:https://caizhongang.github.io/projects/SMPLer-X/

【AiBase提要:】

1. 首次提出了动捕大模型SMPLer-X,用来进行人体全身姿态与体型估计,成功刷新了七个关键榜单。

2. SMPLer-X不仅能够捕捉身体动作,还可以输出面部和手部动作,并估计体型。

3. 研究探索了数据缩放与模型缩放,对32个学术数据集进行排名,展示了在各种测试和榜单中的强大性能。

苹果研究人员推出Ferret:多模态语言模型突破性进展

苹果与哥伦比亚大学的研究人员合作开发了Ferret多模态语言模型,解决了地理信息和语义知识融合问题,实现了引用和定位图像中元素的能力,性能优于传统模型。

AiBase提要:

1. 苹果的Ferret模型解决了地理信息和语义知识融合问题,使其能够引用和定位图像元素。

2. Ferret采用多模态大语言模型(MLLM),处理自由文本和引用区域,性能优于传统模型。

3. 研究人员创建了GRIT数据集,评估Ferret在引用描述、引用推理和对话中的定位任务上表现出卓越性能,性能平均优于其他MLLM模型20.4%。

Monarch Mixer(M2):比Transformer更低成本的模型架构

Monarch Mixer(M2)是一种新的模型架构,通过采用Monarch矩阵替代传统Transformer的注意力和MLP,实现更低成本取得更优的性能,挑战了传统Transformer的优越性。

image.png

论文地址:https://arxiv.org/abs/2310.12109

代码地址:https://github.com/HazyResearch/m2

【AiBase提要】

🌟 Monarch Mixer(M2)采用Monarch矩阵替代注意力和MLP,降低了成本,在多任务上媲美传统Transformer。

🌟 具备次二次复杂度,处理更长序列和高维度表征,同时保持计算效率。

🌟 M2不仅节省参数,还具有更高的硬件效率,是潜在的传统Transformer替代选择。

多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生

中科大研究提出“啄木鸟”框架,可降低多模态大模型的“幻觉”问题,提高准确性,无需重训,为解决大模型问题提供了新方法。

image.png

项目地址:https://github.com/BradyFU/Woodpecker

【AiBase提要:】

😎 “啄木鸟”框架是一种免重训、即插即用的通用架构,通过诊断并纠正多模态大模型的“幻觉”问题,提高准确性。

😎 这一方法包括关键概念提取、问题构造、视觉验证、视觉断言生成,以及幻觉纠正,无需特定数据微调或重新训练模型。

😎 在实验中,“啄木鸟”成功降低了多模态大模型的“幻觉”,提高了答案的准确性,为解决大模型问题提供了有效工具。

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文

  • 3 天
  • 7天