首页 > 业界 > 关键词  > openAI最新资讯  > 正文

AI视野:OpenAI灰度测试GPT4.5;Midjourney V6模型下周发布;Gemini自曝中文用文心一言训练;LeCun提出AGI七阶段路线图

2023-12-18 15:05 · 稿源:站长之家

📰🤖📢AI新鲜事

openAI灰度测试GPT4.5

近日,OpenAI正在对最新的GPT4.5turbo模型进行灰度测试,该模型在文本生成质量、效率、上下文理解、多模态能力、编程和代码生成、安全性、个性化定制等七个方面都取得显著进展。

QQ截图20231218093444.jpg

【AiBase提要】:

🚀 性能提升: GPT4.5turbo在保持生成质量的同时,通过优化计算效率实现更高的响应速度,尤其在处理大型数据集和复杂查询时表现卓越。

🌐 多方面增强: 该模型在上下文理解、多模态能力、编程和代码生成等方面均取得显著进展,展现了更出色的能力。

🔐 安全性提升: OpenAI进一步增强了模型的安全性和对不饱和内容的过滤能力,以降低误用风险。

Gemini自曝中文用文心一言训练

Gemini-Pro在谷歌Vertex AI平台上自称为百度文心大模型,引发网友疑虑。实测发现,中文对话时坚称是文心一言,但使用英文则承认是谷歌训练的大模型。谷歌Gemini-Pro在百度文心一言训练下,引发用户关切,究竟是大公司互相薅羊毛还是深层次技术交流?

image.png

【AiBase提要:】

🤖 Gemini-Pro在中文对话中自称百度文心,引发用户疑虑。

🔄 使用英文对话时,Gemini-Pro承认是谷歌训练的大模型。

❓ 引发关注,是否代表大公司间存在深层次的技术交流?

Midjourney V6模型下周发布

经过半年等待,Midjourney V6模型即将发布,社区评价显示在复杂画面信息还原和内容绘制上有显著提高。

【AiBase提要】

🚀 技术升级: Midjourney V6模型将支持更复杂内容的绘制,社区评价显示在还原画面和内容方面有大幅提高。

💻 评价流程: 社区风格评价中,随机展示V6模型生成的两张图片,参与者选择最喜欢的一张,展示V6模型的质量。

📈 期待升级: 预计V6版本将在圣诞节前发布,为人工智能艺术领域带来新的突破。

字节跳动澄清“OpenAI服务被禁”

字节跳动近期被报道使用OpenAI技术涉嫌违反服务条款,导致账户被封禁。公司负责人澄清违规行为为早期实验性项目的偶发行为,已于4月停止,并在9月进一步采取措施以符合规范。公司表示将在未来几天进行全面排查,以确保严格遵守OpenAI相关服务的使用条款。

【AiBase提要:】

🚨 违规实验: 字节跳动负责人澄清违规行为为早期实验性项目的偶发行为,已在4月停止。

🔄 规范措施: 公司在9月采取措施,确保对OpenAI的API调用符合规范要求。

🔍 全面排查: 字节跳动表示将在未来几天再次全面排查,以确保严格遵守相关服务的使用条款。

LeCun提出AGI七阶段路线图

OpenAI推出「登月计划」,解决超级AI对齐问题,LeCun提出AGI七阶段发展路线图,强调构建学习世界运作方式的系统是首要任务。

论文地址:https://ai.meta.com/blog/yann-lecun-ai-model-i-jepa/

【AiBase提要】

🌐 小模型监督大模型: OpenAI超级对齐团队提出通过小模型监督大模型解决超级AI对齐问题,为超级人工智能的发展奠定基础。

🧠 LeCun的世界模型: LeCun强调构建学习世界运作方式的系统,提出"世界模型"架构,解决当前大模型局限性,迈向通用AGI。

🚀 AGI七阶段发展路线图: LeCun提出AGI发展七阶段,从学习世界运作到超越人类

OpenAI否认与Jony Ive合作开发AI设备

OpenAI首席执行官Sam Altman在接受采访时否认与前苹果设计总监Jony Ive合作开发AI设备。Altman强调OpenAI不参与智能手机市场竞争,对消费硬件的探索仍处于早期阶段。传言中Jony Ive和Altman合作开发的项目细节尚不确定,使得苹果可以放心。

【AiBase提要:】

🤖 Altman否认合作: OpenAI首席执行官Sam Altman否认与Jony Ive合作开发人工智能设备,强调公司不涉足智能手机市场。

🚀 硬件探索初期: Altman表示,OpenAI对消费硬件的探索仍处于早期阶段,项目细节尚不确定。

🤔 传言未证实: 关于传言中的合作项目,Altman未透露具体细节,保持了项目的神秘性。

🤖📈💻💡大模型动态

中国科大发布SciGuard大模型

中国科大等机构发布SciGuard和SciMT-Safety,通过SciGuard大型语言模型驱动的agent,保护AIforScience模型免受滥用风险,并建立首个专注于化学科学领域安全的基准测试。

image.png

论文地址:https://arxiv.org/pdf/2312.06632.pdf

【AiBase提要:】

🛡️ SciGuard保护AI科学模型: SciGuard是大型语言模型,通过智能体控制AI在科学领域的滥用风险,构建记忆库评估风险并提供安全建议。

🧪 科学风险基准建立: 研究团队创建了SciMT-Safety,首个专注于化学科学领域安全的基准测试,用于评估不同AI系统的安全性。

🚀 全球呼吁强化AI监管: 实验证明SciGuard在测试中表现出最小的有害影响,研究团队呼吁全球科技界、政策制定者、伦理学家加强对AI技术的监管,确保科技进步符合人类利益。

🤖📱💼AI应用

腾讯讯云推出高性能应用服务HAI

腾讯云推出HAI高性能应用服务,无需繁琐配置,用户仅需10分钟即可建立自己的AI应用,助力中小企业、开发者和个人用户快速部署高性能应用。

 10 分钟创建AIGC应用,腾讯云推出高性能应用服务HAI

【AiBase提要】

🚀 即插即用服务: HAI提供即插即用的算力和常见环境,支持快速部署语言模型、AI作画、数据科学等高性能应用,降低开发门槛。

💡 智能云资源匹配: HAI根据应用智能匹配最优的云资源,无需选择众多GPU服务器,一键部署方法快速构建环境,大幅提高开发效率。

🎨 多样化应用环境: HAI提供多种预装模型环境,支持自定义部署最新的开源模型,通过可视化界面为开发者提供友好的图形化交互视图,支持多种算力连接方式。

AI图片处理工具Inpaint-web 支持高清修复和图片局部清除

Inpaint-web是一款无需下载客户端的AI图片处理工具,通过WebPGU在浏览器上直接运行。主要支持图片局部清除和将模糊的图片变成高分辨率清晰图。用户可以方便修复图像缺陷、提高图像质量,未来将引入更多功能,完全免费开源。

image.png

项目地址:https://top.aibase.com/tool/inst-inpaint

在线测试地址:https://t.co/Env6tMNW0u

【AiBase提要:】

🌐 在线操作: Inpaint-web通过WebPGU在浏览器上运行,无需下载客户端。

📷 功能丰富: 支持图片局部清除和高清修复,未来将引入图像放大等功能。

🆓 免费开源: Inpaint-web完全免费开源,为用户提供方便快捷的图片处理解决方案。

Novel:一款Notion风格编辑器 搭载AI智能自动补全功能

Novel是一款开源WYSIWYG编辑器,采用Notion风格,通过强大的AI智能自动补全功能提供直观编辑体验,加速文字创作过程。

image.png

项目地址:https://top.aibase.com/tool/novel

【AiBase提要】

🌐 WYSIWYG编辑体验: Novel提供类似Notion的直观编辑界面,实时渲染效果,提高编辑效率。

🧠 AI智能自动补全: 利用OpenAI技术,Novel为用户提供智能自动补全建议,加速文字创作过程。

🚀 易用的安装和集成: 通过NPM包形式提供,简便安装,可轻松集成到现有项目中,支持本地部署和云端。

H&R Block与微软合作推出AI报税助手

全球最大税务机构H&R Block与微软合作推出AI报税助手,通过文本问答实现快速报税、退税,每月35美元的费用覆盖500万用户,准确率100%

图片

产品体验地址:https://www.hrblock.com/online-tax-filing/

【AiBase提要:】

🤖 技术支持与数据保障: H&R Block与微软合作推出的AI Tax Assist得到微软Azure OpenAI的技术支持,使用近70年的税务数据进行预训练和微调,确保准确率100%

💼 服务规模和费用: 该助手每月35美元,已正式为超过500万用户提供服务,支持7*24小时无间断服务,覆盖快速报税、退税、税收管理等业务。

📈 行业影响力与数字化趋势: H&R Block作为全球最大税务服务机构之一,通过AI报税助手展示了税务行业数字化趋势,提高了工作效率并满足用户需求。

👨‍💻💡🎯聚焦开发者

EPFL与苹果联手开源人工智能框架4M

瑞士洛桑联邦理工学院(EPFL)与苹果合作推出的4M框架通过Transformer技术实现跨多模态训练,提高模型灵活性和可扩展性,成功解决了视觉领域多模态训练的挑战。

image.png

项目体验网址:https://4m.epfl.ch/

论文网址:https://arxiv.org/abs/2312.06647

【AiBase提要:】

🌐 多模态挑战: 在自然语言处理领域大型语言模型取得成功的同时,视觉领域需要更灵活可扩展的多模态基础模型。

🤖4M框架: EPFL与苹果提出的"Massively Multimodal Masked Modeling"(4M)框架整合了Transformer技术,具备强大的跨模态能力,通过模态特定的标记器提高兼容性、可扩展性。

🚀 可扩展性与效率:4M通过输入和目标掩码实现高效训练,同时采用模态特定的标记器将各种输入模态转换为离散标记的集合,使单一Transformer能同时处理多种输入模态。

举报

  • 相关推荐
  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • OpenAI发布语音模型GPT-realtim:具备情感感知能力 多语言无缝切换

    OpenAI正式发布语音模型GPT-realtime。 据介绍,GPT-realtime是一款专注于语音AI Agent的多模态模型,能够生成高度自然流畅的语音,精准还原人类语调、情感和语速的丰富变化。该模型支持图像理解,并可结合语音或文本对话使用,非常适合应用于客服、教育、金融、医疗等领域,用于构建高质量的语音智能体。 官方表示,新模型在复杂指令遵循、工具精确调用以及生成更自然、�

  • AI日报:抖音打击AI技术滥用行为;OpenAI 收购开发数据分析平台 Statsig;ElevenLabs 音效模型更新

    抖音打击AI技术滥用行为,对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2,支持长音频和无缝循环。OpenAI收购数据分析平台Statsig,增强产品迭代能力。亚马逊推出Lens Live AI功能,实时扫描购物。谷歌AI推出Stax工具,帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型,提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型,优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld,精准率达92%。瑞士发布开源大模型Apertus,提供多语言处理能力。

  • AI日报:苹果明年推出SiriAI搜索;OpenAI放开ChatGPT Projects功能;Kimi K2-0905 上线 Discord

    本文汇总了AI领域最新动态:苹果与谷歌合作,计划在Siri中引入Gemini AI技术;OpenAI向免费用户开放Projects功能,提升任务管理效率;谷歌推出免费Gemini CLI工具,集成GitHub提升开发效率;OpenAI估值飙升至5000亿美元,二级股票售出103亿美元;苹果自研AI搜索引擎“世界知识问答”计划2026年上线;月之暗面发布Kimi K2-0905模型,提升编程与创意写作能力;Raycast推出Cursor Agent插件优化代码编辑;谷歌发布nano banana官方Prompt模板,助力创意设计。

  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 赫力昂联合Springer Nature旗下自然定制揭秘大脑抗衰

    全球老龄化加速,大脑健康成为焦点。9月16日是中国脑健康日,9月21日是世界阿尔茨海默病日。数据显示,2020至2023年全球60岁以上人口增长40%,达14亿;中国60岁以上人口超3亿,占比22%。阿尔茨海默病带来的经济负担约占GDP的1.47%。科学界正探索维持大脑年轻态的机制,企业合作举办高峰论坛,专家分享前沿研究成果,强调40-60岁是干预黄金窗口期。复合维生素矿物质等营养干预手段显示认知改善潜力,未来需跨学科协作推动大脑抗衰研究普及。

  • AI日报:国产版Nano Banana?即梦图片4.0发布;阿里巴巴发布 Qwen3-Max-Preview;上海重磅发布AI广告扶持政策

    AI日报栏目聚焦人工智能领域最新动态。主要内容包括:即梦图集4.0发布,新增文生图、图像编辑等功能;阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview;小米AI眼镜上线支付宝“看一看”支付功能;微软开源14B参数模型rStar2-Agent在数学推理领域表现突出;MiniMax启动股权激励计划覆盖核心员工;谷歌明确Gemini使用限制,免费用户每日最多5次提示;上海发布AI广告扶持政策,最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。

  • 魅族StarV Snap AI拍照眼镜发布:售价1999 元起

    今日下午魅族22新品发布会上,一款名为StarV Snap的AI拍摄眼镜成为全场焦点。这款突破传统智能眼镜形态的产品以39克超轻人因工学设计惊艳亮相,通过50项人体工程学优化实现重量均匀分散,彻底解决"丑、重、硌"的行业痛点,鼻梁、耳部无压迫感的设计支持全天候舒适佩戴。 外观采用经典框型设计,磨砂质感镜框不仅时尚百搭适配多种脸型,更具备防指纹沾染特性,

  • 软通华方亮相华为全联接大会2025,重磅发布“FunAI³”战略

    2025年9月18日,第十届华为全联接大会在上海开幕,聚焦“跃升行业智能化”主题。软通动力旗下品牌软通华方全新亮相,发布“FunAI³”战略,以“智算筑基、智聚生态、智业深耕”三大路径推动智能算力发展。该战略通过软硬一体全栈智能能力,致力于成为领先的全场景智算产品及服务提供商,赋能千行百业数字化转型升级。

今日大家都在搜的词: