首页 > 业界 > 关键词  > 文心大模型最新资讯  > 正文

AI视野:文心大模型4.0发布;OpenAI计划发布Stateful API;GPT-4V被曝离谱bug;简单搜索升级为AI互动式搜索引擎

2023-10-17 13:51 · 稿源:站长之家

文头.jpg

🤖📈💻💡大模型动态

百度世界2023大会召开 正式发布文心大模型4.0

百度世界大会2023年,百度创始人李彦宏宣布文心大模型4.0正式发布,该模型在理解、生成、逻辑、记忆等核心能力上不逊于GPT-4。

【AiBase提要】

🚀 文心大模型4.0发布:李彦宏宣布升级,与GPT-4媲美。

🧠 百度发布首个生成式商业智能产品“百度GBI”,支持自然语言交互、跨数据库分析和专业知识学习三方面能力

💡 百度网盘、百度文库等产品已完成 AI 重构,实现一键总结视频内容等功能

💡百度地图App发布19.0.0版本 上线AI向导功能

📰🤖📢AI新鲜事

百度简单搜索升级为AI互动式搜索引擎

今日,百度旗下简单搜索宣布升级,成为百度通过大模型重构的第一个AI互动式搜索,提供智能答案和个性化搜索体验。

微信截图_20231017082942.png

体验网址:https://jiandan.baidu.com/

【AiBase提要】

🔍 简单搜索升级,成为首个AI互动式搜索引擎,能提供智能答案和多媒体内容。

🤖 用户可以自由对话,获取答案、视频、图文等多样信息,满足多种需求。

🌐 百度旨在重新定义搜索引擎,让每次搜索更加简单和个性化。

GPT-4V被曝离谱bug:突然执行神秘代码,暴露用户聊天记录

GPT-4V出现严重漏洞,原本只是让它分析一张图片,结果它完全没回答图片内容,而是直接开始执行“神秘”代码,然后用户的ChatGPT聊天记录就被暴露了。

image.png

【AiBase提要】

😱 GPT-4V受攻击注入漏洞,曝出聊天记录。

🤔 漏洞原因在于模型未经重新训练添加图像识别功能。

🔒 提出解决方案是双LLM模式,区分可信和不可信内容。

OpenAI计划发布Stateful API降低开发成本

OpenAI计划通过Stateful API降低应用程序的开发成本,允许开发者更便宜地创建基于AI模型的应用,同时推出新的视觉开发工具。

【AiBase提要】

📉 OpenAI发布Stateful API,记住对话历史,降低应用开发成本。

👁️ 新视觉开发工具将帮助应用程序分析和描述图像。

🤖 OpenAI或考虑发展GPT-5,但引发数据安全和隐私担忧。

王小川旗下百川智能完成3亿美元A1轮融资

王小川旗下的百川智能公司宣布成功完成了3亿美元的A1轮战略融资,得到了阿里、腾讯、小米等科技巨头和多家顶级投资机构的支持。

【AiBase提要】:

🚀 百川智能是王小川创立的公司,不到100天就发布了免费商用的中文大模型,并吸引了数百万的下载量。

🤝 这次融资吸引了包括阿里、腾讯、小米等科技巨头以及多家顶级投资机构的参与,展示了市场对其潜力的信心。

🗓️ 百川智能成立于2023年4月10日,由来自知名科技公司的AI顶尖人才组成,展现了快速发展和创新的能力。

谷歌云推出专为制造和医疗领域的生成式AI解决方案

Google Cloud发布生成式AI,旨在提高生产率和数字时代应对,包括制造业和医疗领域的多个应用。

【AiBase提要:】

🏭 生成式AI在制造领域可用于事件监测、客户服务自动化、文档搜索、产品目录发现和供应链顾问。

🏥 在医疗领域,生成式AI可改善临床数据搜索和提供个性化医疗体验。

🚀 生成式AI应用领域不断扩展,将引领数字时代的创新,提供更多机会。

IDC预测:到2027年,生成式AI支出将达到1430亿美元

IDC预测生成式AI支出将在2027年达到1,430亿美元,增速高于综合AI支出,并相较于全球IT支出的CAGR高出13倍。

【AiBase提要】

📈 到2027年,生成式AI支出将达到1,430亿美元,增速超过综合AI支出,并较全球IT支出的CAGR高出13倍。

🌐 全球主要企业积极投资于生成式AI模型的建设和采用,预计趋势将持续增长。

💼 IDC表示生成式AI是一项变革性技术,具有深远影响和商业价值。

🤖📱💼AI应用

淘宝AI大模型应用“淘宝问问”将上线双11大促模式

淘宝的AI大模型应用“淘宝问问”即将在双11大促期间上线,将为用户提供购买建议,降低挑选决策成本。

【AiBase提要:】

🛒 淘宝的AI大模型应用“淘宝问问”将在双11大促期间提供购买建议,增强用户购物体验。

📊 自9月内测以来,已有超过500万人次尝试该应用,展现了高用户活跃度。

📉 应用将综合各类大促信息,生成最具价格力的购买建议,帮助用户更智能地进行购物决策。

商汤科技秒画SenseMirage上线移动端版本

商汤科技的图像生成平台“秒画SenseMirage”正式推出移动端版本,用户可以通过手机登录官网进行文生图创作,并享受美学引导、高效工具和API接口支持。

微信截图_20231017144033.png

体验网址:https://miaohua.sensetime.com

【AiBase提要:】

🎨 秒画SenseMirage移动端版本正式上线,开放免费创作,提供用户文生图创作体验。

📐 更新的3.5版本引入全新美学引导系统和ControlNet工具,提高创作效率和质量。

🏢 商汤将向企业客户提供API接口,助力高效服务和创意构建。

英伟达文本转3D AI工具Masterpiece X首次亮相

英伟达与Masterpiece Studio合作发布Masterpiece X,利用生成式AI简化3D建模,虽然测试效果不佳,但显示出巨大潜力。

📌 AiBase提要:

1. 英伟达与3D软件开发商Masterpiece Studio合作发布了Masterpiece X,旨在通过生成式AI简化3D建模,使之像创建二维图像一样简单。

2. Masterpiece Studio表示其解决方案无需本地硬件或软件,一切在云端实现,仅需键盘、浏览器和想象力。

3. 尽管测试中的效果不尽如人意,但这一技术显示出从现有模型开始更容易获得所需结果的潜力。

YouTube推出AI广告工具“Spotlight Moments”助广告商瞄准文化时刻

YouTube宣布推出名为“Spotlight Moments”的AI广告套餐,利用Google人工智能,帮助广告商在特定文化时刻投放相关广告,提高广告效果。

🚀 【AiBase提要:】

👉 YouTube推出“Spotlight Moments”广告套餐,利用AI自动识别热门视频。

👉 广告商可在特定文化时刻投放广告,提高品牌曝光。

👉 Google致力于改进广告销售和投放方式,推出多项AI驱动的工具。

3D领域的Midjourney?Luma AI助您捕捉真实之美

Luma AI是一款引人入胜的3D捕捉技术,以其无与伦比的光线和反射效果,将未来的视觉效果技术带给每个人,从专业人士到普通用户,彻底改变了创意产业。

image.png

体验地址:https://lumalabs.ai/

【AiBase提要】:

🌟 Luma AI引领革命性3D捕捉技术,以前所未有的逼真度和细节捕捉世界,超越传统摄影和渲染的视觉效果。

🌟 具备无与伦比的光线和反射效果,让3D场景看起来就像是真实的一样,无论是室内还是室外。

🌟 Luma AI的愿景是将未来的视觉效果技术普及给每个人,支持多平台,轻松捕捉逼真的3D图像,改变游戏开发、虚拟现实和影视制作的方式。

AI漫画创作工具Dashtoon 支持移除背景、修整脸部

Dashtoon Studio是一款强大的AI漫画创作平台,基于AI技术,支持用户移除背景、修整脸部,以轻松创作具有创意的漫画作品。

image.png

体验地址:https://www.dashtoon.ai/

【AiBase提要:】

1. 🎨 Dashtoon Studio是引人注目的AI漫画创作平台,为创作者提供更大的创作力量和规模。

2. ✂️ 用户可以选择漫画角色,定制角色,并使用工具移除背景、修整脸部,提升图像质量。

3. 💬 平台鼓励用户积极参与社区,分享经验和技巧,无论专业还是新手,都能轻松创作出卓越的漫画作品。

视频编辑器CapCut扩展业务版块 ☁️

CapCut是字节跳动旗下的视频编辑应用,现在正在扩展到商业工具领域。其中新增人工智能驱动的脚本生成等功能,可帮助广告商和创作者制作广告和品牌内容。📲

6383313146957928013497826.jpg

【AiBase提要:】

😊 CapCut推出CapCut for Business,面向广告商和创作者提供视频制作工具

📈 新增人工智能驱动的脚本生成等功能,可快速制作视频广告

🎬 提供虚拟演示者和虚拟试穿等AI功能,方便营销产品

👨‍💻💡🎯聚焦开发者

香港中文大学发布全面中文大语言模型评测CLEVA

香港中文大学发布了全面中文大语言模型评测方法CLEVA,覆盖31个任务和多维度评测指标,旨在提供更准确的模型认知。

image.png

论文地址:https://arxiv.org/pdf/2308.04813.pdf

【AiBase提要】

📊 香港中文大学发布全面中文大语言模型评测方法CLEVA,已被EMNLP2023System Demonstrations录取。

🎯 评测方法包含31个任务和多种评测指标,覆盖了84个数据集,关注准确性、鲁棒性、公平性等多维度。

🖥️ CLEVA提供提示模板,降低数据污染风险,为研究团队提供清晰的操作界面,促进模型认知和评测。

举报

  • 相关推荐
  • 大家在看
  • Sonauto :利用AI创作流行歌曲

    Sonauto 索纳托是一款结合人工智能技术的音乐创作平台,用户可以通过该平台轻松创作出流行歌曲。产品功能包括旋律生成、歌词创作、曲风选择等,旨在简化音乐创作流程,让音乐爱好者和专业人士都能快速创作出高质量的音乐作品。优势在于AI的高效算法和丰富的音乐素材库,支持用户进行个性化创作。定价方面,Sonauto 索纳托提供免费试用和付费订阅服务,以满足不同用户的需求。

  • August:, 你的健康伴侣

    August 是一个免费的健康人工智能平台,提供24/7的咨询服务。无论你面临健康问题、心理健康问题、营养与健身问题,还是需要支持和指导,August 都可以帮助你。它可以回答你的健康问题、提供个性化建议、定期关怀你的健康状态等。

  • robotika.ai:通过AI辅助做出明智的投资决策

    RoboFin是您的AI动力投资分析师。它通过分析大量的数据,提供基于数据分析的清晰可行的投资建议,帮助您做出明智的投资决策。RoboFin的优势包括减轻压力、节约时间、提高投资回报等。

  • GpuMall智算云:面向AI开发者的GPU云平台,高性价比,极致体验,计费灵活

    GpuMall智算云是一个面向AI开发者的GPU云平台,提供高性价比的计算资源,灵活的计费方式,以及弹性的调度能力,可以满足AI开发者的各种需求。用户可以在这里快速租用GPU资源进行AI模型训练和推理,并且可以根据实际使用情况灵活调整资源配置,达到最佳性价比。平台还提供了丰富的使用文档和在线客服支持,让用户使用起来更加便捷。

  • ACEPAL:个性化营销建议

    ACEPAL 是一个个性化营销建议平台,为数千个营销任务提供个性化建议。它利用动态提示生成器和优化聊天机器人来提升营销效果。ACEPAL 可以帮助分析Facebook、Twitter、LinkedIn、Instagram、Pinterest、TikTok和YouTube等平台的数据,并根据不同任务和变量提供定制化的营销建议。它的功能包括分析受众洞察、分析竞争对手策略、优化内容策略、提供最佳时机建议等。ACEPAL的价格根据用户需求定制,请联系我们获取详细定价信息。

  • LLM Transparency Tool:分析Transformer语言模型的内部工作机制

    LLM Transparency Tool(LLM-TT)是一个开源的交互式工具包,用于分析基于Transformer的语言模型的内部工作机制。它允许用户选择模型、添加提示并运行推理,通过可视化的方式展示模型的注意力流动和信息传递路径。该工具旨在提高模型的透明度,帮助研究人员和开发者更好地理解和改进语言模型。

  • JetMoE-8B:以低成本实现高性能的大型语言模型

    JetMoE-8B是一个开源的大型语言模型,通过使用公共数据集和优化的训练方法,以低于10万美元的成本实现了超越Meta AI LLaMA2-7B的性能。该模型在推理时仅激活22亿参数,大幅降低了计算成本,同时保持了优异的性能。

  • CTRL-F-VIDEO:在视频中快速搜索特定单词或短语

    CTRL-F-VIDEO 是一个开源项目,通过Chrome扩展实现在YouTube视频中搜索特定单词或短语的功能。它利用OpenAI的Whisper模型将音频转换为文本,并在视频时间条上标记出匹配词汇的位置,帮助用户节省查找信息的时间。

  • Breezemail:整理你的收件箱,AI分类

    Breezemail帮助你保持重要的邮件在收件箱内,并通过AI分类整理其余的邮件。我们训练了AI来识别对你重要的邮件,将其标记为重要邮件,并将其余的邮件自动组织到智能分类中。你可以使用预定义的分类,也可以创建自己的智能分类。Breezemail使用ChatGPT查询来组织你的邮件,不再需要复杂的过滤器和编程运算符来构建邮件标签。现在,你可以使用自然语言轻松创建自己的个性化超级高级分类。例如:“所有关于金融和投资的邮件”。Breezemail还提供了预定义的分类,帮助你无需努力就可以整理收件箱。订阅Breezemail,让我们的AI发挥魔力,相信你的收件箱会感谢你的。安全与隐私方面,Breezemail致力于保护您的安全和隐私。我们不会保留、出售或分析您的数据,除非与我们的公开可访问功能相关。我们不会展示广告,因为我们会为我们的服务收取公平的订阅费用。我们不会共享、出售或试图使您的数据匿名化,您的数据包括您的电子邮件地址、在您的邮箱中发现的电子邮件地址,以及电子邮件内容和附件。您的电子邮件内容仅由ChatGPT处理。我们使用ChatGPT来处理和分类您的电子邮件内容,所有包括文本、图片、附件等的电子邮件内容都直接发送到ChatGPT API,Breezemail不在服务器上处理或保留您的任何内容。您可以随时授予Breezemail访问您的邮箱,并且可以随时撤销。所有访问令牌都经过加密,仅用于执行与我们功能相关的操作。您的凭据也经过加密,以保护您的邮箱访问细节,使其对Breezemail内部的任何人都无法访问。订阅我们的通讯,获取有关Breezemail的更新。谢谢!

  • Somi AI:AI写作与助手工具

    Somi AI是最受欢迎的高等教育、市场营销人员、企业主、影响者和作家的AI写作软件工具。我们的AI助手引擎帮助您更好、更快地写作。

  • S&C - Gemini™ AI chat for Google™ search:在Google™搜索中与Gemini™ AI聊天

    S&C - Gemini™ AI chat for Google™ search是一款能够在Google™搜索中与Gemini™ AI进行聊天的插件。它提供Gemini™、ChatGPT™、Claude™和Pi™等多个聊天机器人,可以在搜索页面上直接与它们进行对话。插件支持Google™、Yahoo™和DuckduckGo™等搜索引擎,并且提供无限制的免费查询次数。

  • Jinno: code any React component with AI:用AI开发HTML或React组件,并与GPT4聊天

    Jinno是一个使用AI开发HTML或React组件的插件。它可以修改React、HTML和CSS代码。它支持React、CSS和JavaScript,并提供了颜色选择器、字体选择器、页面标尺等功能。可以导出React、HTML和CSS代码,适用于开发人员和设计师。

  • Free Email Extractor from Website:强大的免费网络电子邮件抓取工具,自动访问网站以快速提取批量电子邮件、电话号码和社交资料,支持域名到电子邮件查找。

    My Email Extractor是一个强大的免费网络电子邮件抓取工具,它可以自动访问网站并快速提取电子邮件、电话号码和社交资料。它支持从不同域名提取电子邮件,并将结果保存到CSV文件中。用户可以使用它来生成销售线索、进行市场研究以及数据自动化。My Email Extractor的准确性取决于数据来源,它实时从网页中收集电子邮件。

  • WizardLM-2:新模型,多种型号,AI驱动合成数据训练

    WizardLM-2是WizardLM推出的新一代大型语言模型,包含三种型号:8x22B、70B和7B。该产品采用AI驱动的合成数据训练系统,通过数据分析、加权抽样、渐进式学习和AI互校AI等方法,优化模型性能。它能够自动生成高品质的指令和响应,提供多样化的对话能力,适用于多种编程和开发场景。

  • idefics-80b:一个通用的多模态模型,可用于问答、图像描述等任务

    HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。

  • Video2Game:从单一视频创建实时互动游戏环境

    Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。

  • Cohere Compass:多方面数据索引与搜索模型

    Cohere Compass是一款新型的多方面嵌入模型,专为解决企业数据中的多重概念和关系检索挑战而设计。它能够将数据以JSON格式传递至嵌入模型,转换后存储在向量数据库中,保持元数据和文本的同时,捕捉多方面数据中概念间的关系。与传统的RAG流程相比,Compass通过其SDK将电子邮件及其附件解析为单一JSON,生成包含多方面表示的嵌入输出,从而在搜索时能够准确理解和匹配查询中的不同方面。

  • Ctrl-Adapter:视频生成的精细控制工具

    Ctrl-Adapter是一个专门为视频生成设计的Controlnet,提供图像和视频的精细控制功能,优化视频时间对齐,适配多种基础模型,具备视频编辑能力,显著提升视频生成效率和质量。

  • Reka Core:强大的多模态LLM,商业解决方案

    Reka Core是一个GPT-4级别的多模态大型语言模型(LLM),具备图像、视频和音频的强大上下文理解能力。它是目前市场上仅有的两个商用综合多模态解决方案之一。Core在多模态理解、推理能力、编码和Agent工作流程、多语言支持以及部署灵活性方面表现出色。

  • 2txt:快速将图片中的文字转换为可编辑文本

    2txt是一个在线OCR工具,能够将图片中的文字内容快速识别并转换成可编辑的文本格式。它支持多种语言的识别,并且操作简单,用户只需上传图片即可获得结果。该工具不存储用户上传的图片,保证了用户数据的隐私安全。

今日大家都在搜的词: