首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

AI日报:GPT-4o灰测语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放

2024-07-31 14:57 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI向ChatGPT Plus用户推出高级语音模式

OpenAI宣布推出高级语音模式,提供更自然、实时的对话体验,允许用户打断并感知回应情绪。测试用户将收到电子邮件,计划在秋季让所有Plus用户访问。视频和屏幕共享功能也将推出。GPT-4o经过多语言测试,保护隐私并计划发布评估报告。

【AiBase提要:】

🔊 高级语音模式提供更自然、实时的对话体验,允许用户打断并感知回应情绪。

📧 测试用户将通过电子邮件收到说明,计划秋季全面开放给Plus用户。

🔗 OpenAI计划发布GPT-4o的能力、局限性和安全性评估报告。

2、OpenAI开放新模型gpt-4o-64k-output-alpha,GPT-4o API最长可支持64K 输出

OpenAI推出了新的实验性模型gpt-4o-64k-output-alpha,最大亮点是一次性输出64K长度的token,提供更丰富和详尽的内容,但价格更高。该模型满足用户对更长文本的需求,支持写作、编程和数据分析。长文本生成费用为每百万个输出token18美元,旨在与计算成本匹配,鼓励合理利用工具。

image.png

【AiBase提要:】

📈 GPT-4o模型支持最长64K输出,适合需要详细内容的用户。

💰 长文本生成费用高,每百万个输出令牌收费18美元。

📝 模型推动创作、研究领域的新可能性,促进更深入的交流与创作。

3、Midjourney V6.1版本上线 优化远景人脸,细节更丰富

Midjourney官方推出V6.1版本,带来更智能、更快、更清晰、细节更丰富、更美观的更新。此次更新突破图像连贯性、全面提升画质、精准处理微观细节,优化性能与速度,提高文本准确性,升级个性化模型,新增--q2模式,整体美学提升。

image.png

【AiBase提要:】

✨ 图像连贯性的突破:处理复杂结构更自然流畅,提升创作信心。

🌟 画质的全面提升:减少像素伪影,增强纹理表现力,提供更广阔风格表现空间。

🔍 微观细节的精准把控:处理小图像特征惊人,增强作品真实感与表现力。

详情链接:https://top.aibase.com/tool/midjourneywangyeban

4、小米“大模型小爱”全量升级:支持AI图片编辑等功能

小米公司宣布全新大模型版本的小爱同学即将全面升级,涵盖智能手机、平板电脑、智能电视、智能音箱和汽车等产品线。升级带来创新功能如AI图片编辑和车外唤醒防御。各产品线功能升级将提升用户体验和实用性。

image.png

【AiBase提要:】

🚀 小爱同学全面升级,涵盖多产品线,带来创新功能。

💡 智能手机端专注AI图片编辑、文档问答、智能成片制作。

📺 智能电视端提供影视知识问答、健身休闲指导和家庭计划制定。

5、百度飞桨PaddleX3.0-beta昇腾版发布

PaddleX3.0-beta昇腾版是飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。该版本聚焦7大主流AI场景,提供丰富的模型选择和低代码开发方式,深度适配华为昇腾910芯片,为用户提供便捷的开发范式。

image.png

【AiBase提要:】

🚀 丰富的模型选择,覆盖多个任务场景,包括图像分类、目标检测、文本图像版面分析等

⚙️ 低代码开发方式,统一API接口实现全流程开发,支持用户自定义模型流程串联

💻 深度适配华为昇腾910芯片,满足用户多样化需求

详情链接:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6、AI虚拟换衣模型CatVTON:参数小仅899.06M 支持高分辨率

CatVTON是一款适合时尚爱好者使用的小型AI虚拟换衣模型,拥有轻量级网络和低显存需求,支持高分辨率操作。最新发布的代码和部署流程让用户能轻松在家体验虚拟试妆技术,同时支持在ComfyUI和Gradio应用上部署,操作便捷。

image.png

【AiBase提要:】

🐈 轻量级网络,总参数899.06M,训练参数49.57M,推理时显存需求低于8G,适合个人电脑操作。

💻 支持在ComfyUI上快速部署,简单几步即可体验虚拟试妆技术。

👗 可在VITON-HD和DressCode数据集上进行推理,支持多种精度选项,适应不同硬件条件。

详情链接:https://top.aibase.com/tool/catvton

7、AI换发型神器Stable-Hair:实现发型迁移

Stable-Hair是一项创新的头发转移技术,解决了传统方法无法处理复杂发型的问题,为用户带来全新的试发体验。经过大量实验验证,Stable-Hair在发型转移效果上达到行业领先水平,提升了用户的试发体验。

image.png

【AiBase提要:】

🌟 Stable-Hair解决了传统方法无法处理复杂发型的问题

👨‍🔬 采用两阶段处理流程,先去除头发再进行发型转移

🏆 Stable-Hair在实验中表现出色,达到行业领先水平

详情链接:https://github.com/Xiaojiu-z/Stable-Hair

8、粉丝化身纯爱战士!用AI拥抱相柳引爆社交平台

这篇文章讨论了人工智能技术在虚拟情感表达领域的应用,以热播剧《长相思2》中角色相柳为例,粉丝们通过AI生成的视频与角色互动,展现了一种新颖的情感宣泄方式。然而,文章也提醒人们需警惕过度沉浸在虚拟世界的风险,保持现实生活中的情感平衡。

image.png

【AiBase提要:】

🤖 AI技术助力粉丝用虚拟互动表达情感,创新的视频生成方式引发狂欢

💑 AI情侣合照在社交平台上流行,粉丝实现与偶像亲密接触的梦想

🧠 AI技术深刻影响娱乐领域,提供新颖方式处理对虚构角色的情感依恋

9、Meta关闭明星聊天机器人项目,聚焦AI创作工具AI Studio

Meta最近宣布关闭其明星聊天机器人项目,转向AI Studio,这是一款新工具允许创作者制作自己的聊天机器人。尽管之前投入了大量资金,但明星聊天机器人项目未达预期,Meta仍对AI聊天机器人抱有希望。CEO扎克伯格强调了AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

image.png

【AiBase提要:】

🔥 Meta关闭明星聊天机器人项目,专注于AI创作工具AI Studio。

💰 公司为名人肖像支付高额费用,但项目未达预期。

🤖 CEO扎克伯格强调AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

10、抖音博主“玛珂娜”又出神作!AI续写《童话镇》抽象填词获赞73万

最近,抖音平台上一首由AI重新填词并演唱的《童话镇》引发轰动,赞数超过73万,成为网络热议焦点。AI版本歌词充满抽象意象,演唱出色,引发深度思考。AI创作引发人们对抽象思维、创作逻辑的思考。同时反映了网络文化对新奇内容的追捧,AI创作需理性看待。AI版《童话镇》展示了AI在创意领域可能性,增加公众对AI艺术创作兴趣。

image.png

【AiBase提要:】

⚡ AI重新填词的《童话镇》在抖音引发轰动,赞数超过73万,展示了AI在音乐创作领域的潜力。

🎭 AI版本歌词充满抽象意象,演唱出色,引发人们对AI创造力的深度思考。

🌐 当代网络文化对新奇、幽默内容的追捧,AI创作需理性看待,探索AI创造力的本质和边界。

详情点此了解:https://www.aibase.com/zh/news/10692

11、周鸿祎宣布360安全大模型免费

周鸿祎宣布360集团将免费开放360安全大模型,旨在普及大模型技术,推动安全行业的技术进步和生产力的变革,让更多企业和个人能够负担得起并有效利用大模型技术。

【AiBase提要:】

🔑360集团免费开放360安全大模型,旨在普及大模型技术,推动安全行业技术进步。

💡 对购买360标准产品的用户免费提供大模型标准功能,实现产品功能增强。

🚀360集团成功开发具有千亿级参数的自研通用大模型——360智脑,展现在市场中的影响力和技术实力。

12、雷军称如果没造车多半在干AI:30多年前修了一堆AI课程

雷军在最近的访谈中透露,如果小米没有进入汽车制造领域,公司可能更多地聚焦于人工智能领域。尽管投入造车项目,小米在人工智能方面并未落后行业,早在2016年就开始全面投入AI领域。雷军本人对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

【AiBase提要:】

🚗 小米可能更多聚焦于人工智能领域,若未进入汽车制造领域。

💡 小米在人工智能方面并未落后行业,早在2016年开始全面投入AI领域。

💼 雷军对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

举报

  • 相关推荐
  • 性能超越GPT-4o及Qwen2.5-VL,百度超轻量小模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

    百度发布超轻量级文字识别模型PP-OCRv5,仅0.07B参数却实现媲美700亿参数大模型的OCR精度。在多项测试中超越GPT-4o等通用视觉大模型,尤其在文本定位和边界框精度上表现优异。该模型支持5种文字类型识别,适用于教育、医疗、法律等多行业数字化需求,累计下载量超900万,是GitHub上唯一Star数超5万的中国OCR项目。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • Qwen3-Max成阿里通义“地表最强”:性能超GPT5 数学推理直接满分

    9月24日,2025云栖大会开幕,阿里通义千问旗舰模型Qwen3-Max重磅亮相,性能超越GPT-5、Claude+Opus 4等,跻身全球前三。该模型包含指令和推理两大版本,预训练数据量达36T tokens,总参数超万亿,具备极强编程和工具调用能力。在SWE-Bench测试中,指令版斩获69.6分全球第一;Tau2-Bench工具调用测试达74.8分,超越同类模型。推理增强版Qwen3-Max-Thinking在数学推理测试中获满分,国内首次突破。通义千问系列已实现全尺寸覆盖,包含三百多个模型。即日起,用户可在QwenChat免费体验Qwen3-Max,或通过阿里云百炼平台调用API服务。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 小米15T/15T Pro发布:小米最强天玑旗舰 5400元起

    9月25日,小米在海外正式发布15T和15T Pro两款旗舰手机。15T起售价650欧元(约5400元),15T Pro起售价800欧元(约6700元),均为12GB+256GB起步。两款机型设计基本一致,主要差异在核心配置:15T Pro搭载天玑9400+处理器、144Hz刷新率屏幕、90W有线+50W无线充电,后置三摄支持8K视频录制;15T采用天玑8400-Ultra、120Hz屏幕、67W有线快充。两者均配备6.83英寸OLED屏、5500mAh电池及相似影像系统。

  • 华为WATCH GT 6/Pro系列手表发布 售价1488元起

    华为于9月24日正式发布WATCH GT6系列智能手表,起售价1488元。该系列提供41mm和46mm两种尺寸,搭载OLED屏幕,续航最长可达21天,支持5ATM防水和IP69防尘。GT6 Pro新增跌倒检测、ECG心电图分析及专业运动模式,并配备蓝宝石玻璃表镜。全系采用高硅叠片电池技术,能量密度提升37%,支持无线快充。此外,首次应用骑行模拟功率功能,并搭载TruSense技术,精准监测心率、血氧等健康指标。GT6 Pro起售价2488元,进一步满足专业用户需求。

  • HTTP 402与微支付:一段沉睡三十年的代码,在AI时代觉醒

    30年前HTTP 402协议因交易成本高、体验割裂和技术缺失而失败,如今AI时代带来消费原子化、决策流线化和主体去人化三大变革,使微支付成为可能。AI代理通过钱包身份、风控机制和无缝支付协议实现高频小额交易,重构互联网经济逻辑,让HTTP 402从理想变为AI经济的支付基石。

  • 女子用ChatGPT选号中百万大奖 全部捐出帮助有需要的人

    美国弗吉尼亚州女子卡丽爱德华为非经常购彩者,近日通过手机向ChatGPT询问彩票号码建议,AI提供几组数字供参考。她购买后幸运中得15万美元(约106万元人民币)大奖。领奖时她当场宣布将全部奖金捐出,帮助有需要的人,并表示自己已足够幸运,希望以此鼓励其他中奖者回馈社会。

  • OPPO Find X9系列外观公布:共有4款配色

    9月23日,OPPO正式揭晓Find X9系列外观设计,采用独特小矩阵相机DECO,推出绒砂钛、绒光钛、霜白、雾黑四款配色。该系列工艺精湛,绒砂钛版实现镜组与机身一体感,正面配备极窄四等边直屏与金属直角边框。核心配置搭载联发科天玑9500平台,采用第三代3纳米工艺,集成全新CPU、GPU G1-Ultra及Imagiq 1190影像处理器,性能、功耗、影像和AI能力显著提升,GeekBench单核跑分达4007,多核11217。此外,首发搭载全场景真1nit明眸护眼屏,从材料到算法均由OPPO深度定制,实现端到端显示素质把控,提升视觉舒适度。

  • OPPO Watch S官宣:轻薄表皇

    OPPO宣布将于10月16日推出OPPO Watch S智能手表,主打“轻薄表皇”设计,厚度不足9mm,号称目前市面上最薄的智能圆表。搭载全新智能手表系统,操作体验媲美手机,健康配置亦有惊喜。同时具备“健身教练”功能,可自动识别运动并提供超100种运动模式,专业记录数据。此外,发布会还将推出OPPO Find X9和X9 Pro旗舰手机,首批搭载联发科天玑9500平台,出厂预装全新ColorOS 16系统。

今日大家都在搜的词: