首页 > 业界 > 关键词  > GPT-4o最新资讯  > 正文

AI日报:GPT-4o灰测语音功能,ChatGPT版Her来了;Midjourney V6.1上线;360安全大模型免费开放

2024-07-31 14:57 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、OpenAI向ChatGPT Plus用户推出高级语音模式

OpenAI宣布推出高级语音模式,提供更自然、实时的对话体验,允许用户打断并感知回应情绪。测试用户将收到电子邮件,计划在秋季让所有Plus用户访问。视频和屏幕共享功能也将推出。GPT-4o经过多语言测试,保护隐私并计划发布评估报告。

【AiBase提要:】

🔊 高级语音模式提供更自然、实时的对话体验,允许用户打断并感知回应情绪。

📧 测试用户将通过电子邮件收到说明,计划秋季全面开放给Plus用户。

🔗 OpenAI计划发布GPT-4o的能力、局限性和安全性评估报告。

2、OpenAI开放新模型gpt-4o-64k-output-alpha,GPT-4o API最长可支持64K 输出

OpenAI推出了新的实验性模型gpt-4o-64k-output-alpha,最大亮点是一次性输出64K长度的token,提供更丰富和详尽的内容,但价格更高。该模型满足用户对更长文本的需求,支持写作、编程和数据分析。长文本生成费用为每百万个输出token18美元,旨在与计算成本匹配,鼓励合理利用工具。

image.png

【AiBase提要:】

📈 GPT-4o模型支持最长64K输出,适合需要详细内容的用户。

💰 长文本生成费用高,每百万个输出令牌收费18美元。

📝 模型推动创作、研究领域的新可能性,促进更深入的交流与创作。

3、Midjourney V6.1版本上线 优化远景人脸,细节更丰富

Midjourney官方推出V6.1版本,带来更智能、更快、更清晰、细节更丰富、更美观的更新。此次更新突破图像连贯性、全面提升画质、精准处理微观细节,优化性能与速度,提高文本准确性,升级个性化模型,新增--q2模式,整体美学提升。

image.png

【AiBase提要:】

✨ 图像连贯性的突破:处理复杂结构更自然流畅,提升创作信心。

🌟 画质的全面提升:减少像素伪影,增强纹理表现力,提供更广阔风格表现空间。

🔍 微观细节的精准把控:处理小图像特征惊人,增强作品真实感与表现力。

详情链接:https://top.aibase.com/tool/midjourneywangyeban

4、小米“大模型小爱”全量升级:支持AI图片编辑等功能

小米公司宣布全新大模型版本的小爱同学即将全面升级,涵盖智能手机、平板电脑、智能电视、智能音箱和汽车等产品线。升级带来创新功能如AI图片编辑和车外唤醒防御。各产品线功能升级将提升用户体验和实用性。

image.png

【AiBase提要:】

🚀 小爱同学全面升级,涵盖多产品线,带来创新功能。

💡 智能手机端专注AI图片编辑、文档问答、智能成片制作。

📺 智能电视端提供影视知识问答、健身休闲指导和家庭计划制定。

5、百度飞桨PaddleX3.0-beta昇腾版发布

PaddleX3.0-beta昇腾版是飞桨推出的端云协同低代码开发工具,旨在帮助开发者以低成本和零门槛的方式解决产业中的实际问题。该版本聚焦7大主流AI场景,提供丰富的模型选择和低代码开发方式,深度适配华为昇腾910芯片,为用户提供便捷的开发范式。

image.png

【AiBase提要:】

🚀 丰富的模型选择,覆盖多个任务场景,包括图像分类、目标检测、文本图像版面分析等

⚙️ 低代码开发方式,统一API接口实现全流程开发,支持用户自定义模型流程串联

💻 深度适配华为昇腾910芯片,满足用户多样化需求

详情链接:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6、AI虚拟换衣模型CatVTON:参数小仅899.06M 支持高分辨率

CatVTON是一款适合时尚爱好者使用的小型AI虚拟换衣模型,拥有轻量级网络和低显存需求,支持高分辨率操作。最新发布的代码和部署流程让用户能轻松在家体验虚拟试妆技术,同时支持在ComfyUI和Gradio应用上部署,操作便捷。

image.png

【AiBase提要:】

🐈 轻量级网络,总参数899.06M,训练参数49.57M,推理时显存需求低于8G,适合个人电脑操作。

💻 支持在ComfyUI上快速部署,简单几步即可体验虚拟试妆技术。

👗 可在VITON-HD和DressCode数据集上进行推理,支持多种精度选项,适应不同硬件条件。

详情链接:https://top.aibase.com/tool/catvton

7、AI换发型神器Stable-Hair:实现发型迁移

Stable-Hair是一项创新的头发转移技术,解决了传统方法无法处理复杂发型的问题,为用户带来全新的试发体验。经过大量实验验证,Stable-Hair在发型转移效果上达到行业领先水平,提升了用户的试发体验。

image.png

【AiBase提要:】

🌟 Stable-Hair解决了传统方法无法处理复杂发型的问题

👨‍🔬 采用两阶段处理流程,先去除头发再进行发型转移

🏆 Stable-Hair在实验中表现出色,达到行业领先水平

详情链接:https://github.com/Xiaojiu-z/Stable-Hair

8、粉丝化身纯爱战士!用AI拥抱相柳引爆社交平台

这篇文章讨论了人工智能技术在虚拟情感表达领域的应用,以热播剧《长相思2》中角色相柳为例,粉丝们通过AI生成的视频与角色互动,展现了一种新颖的情感宣泄方式。然而,文章也提醒人们需警惕过度沉浸在虚拟世界的风险,保持现实生活中的情感平衡。

image.png

【AiBase提要:】

🤖 AI技术助力粉丝用虚拟互动表达情感,创新的视频生成方式引发狂欢

💑 AI情侣合照在社交平台上流行,粉丝实现与偶像亲密接触的梦想

🧠 AI技术深刻影响娱乐领域,提供新颖方式处理对虚构角色的情感依恋

9、Meta关闭明星聊天机器人项目,聚焦AI创作工具AI Studio

Meta最近宣布关闭其明星聊天机器人项目,转向AI Studio,这是一款新工具允许创作者制作自己的聊天机器人。尽管之前投入了大量资金,但明星聊天机器人项目未达预期,Meta仍对AI聊天机器人抱有希望。CEO扎克伯格强调了AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

image.png

【AiBase提要:】

🔥 Meta关闭明星聊天机器人项目,专注于AI创作工具AI Studio。

💰 公司为名人肖像支付高额费用,但项目未达预期。

🤖 CEO扎克伯格强调AI聊天机器人的重要性,继续在多个平台推广Meta AI助手。

10、抖音博主“玛珂娜”又出神作!AI续写《童话镇》抽象填词获赞73万

最近,抖音平台上一首由AI重新填词并演唱的《童话镇》引发轰动,赞数超过73万,成为网络热议焦点。AI版本歌词充满抽象意象,演唱出色,引发深度思考。AI创作引发人们对抽象思维、创作逻辑的思考。同时反映了网络文化对新奇内容的追捧,AI创作需理性看待。AI版《童话镇》展示了AI在创意领域可能性,增加公众对AI艺术创作兴趣。

image.png

【AiBase提要:】

⚡ AI重新填词的《童话镇》在抖音引发轰动,赞数超过73万,展示了AI在音乐创作领域的潜力。

🎭 AI版本歌词充满抽象意象,演唱出色,引发人们对AI创造力的深度思考。

🌐 当代网络文化对新奇、幽默内容的追捧,AI创作需理性看待,探索AI创造力的本质和边界。

详情点此了解:https://www.aibase.com/zh/news/10692

11、周鸿祎宣布360安全大模型免费

周鸿祎宣布360集团将免费开放360安全大模型,旨在普及大模型技术,推动安全行业的技术进步和生产力的变革,让更多企业和个人能够负担得起并有效利用大模型技术。

【AiBase提要:】

🔑360集团免费开放360安全大模型,旨在普及大模型技术,推动安全行业技术进步。

💡 对购买360标准产品的用户免费提供大模型标准功能,实现产品功能增强。

🚀360集团成功开发具有千亿级参数的自研通用大模型——360智脑,展现在市场中的影响力和技术实力。

12、雷军称如果没造车多半在干AI:30多年前修了一堆AI课程

雷军在最近的访谈中透露,如果小米没有进入汽车制造领域,公司可能更多地聚焦于人工智能领域。尽管投入造车项目,小米在人工智能方面并未落后行业,早在2016年就开始全面投入AI领域。雷军本人对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

【AiBase提要:】

🚗 小米可能更多聚焦于人工智能领域,若未进入汽车制造领域。

💡 小米在人工智能方面并未落后行业,早在2016年开始全面投入AI领域。

💼 雷军对AI有深刻理解,近两年主要精力集中在汽车项目,但仍在积极开展AI相关工作。

举报

  • 相关推荐
  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

  • ChatGPT 5更新:三种模式可选 4o重新回归

    OpenAI首席执行官Sam Altman在社交媒体上宣布,ChatGPT 5正式推出三种可选模式:自动(Auto)、快速(Fast)和思考(Thinking)。

  • OpenAI发布2款开源模型:gpt-oss系列 能力接近o3和o4-mini

    OpenAI发布开源模型系列GPT-OSS,包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构,20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口,支持动态参数调节和任务微调优化,性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能,包括网页交互和Python代码执行,在标准化测试中表现优异。开源策略为开发者提供高性能替代方案,重新定义了AI模型的应用边界。

  • 2025年大模型选型核心指南:Beyond GPT-4,如何理性评估Qwen、DeepSeek等强者?

    大模型选择能力已成为AI时代企业核心竞争力。文章提出“能力-成本-场景”三维评估框架,强调需超越单一指标崇拜,基于客观数据和实际需求进行理性选择。通过Qwen2-Plus与DeepSeek-V3的对比分析,展示不同模型在特定场景下的差异化优势。建议企业建立科学选型流程,采用专业工具进行多维度评估,通过三阶段验证策略确保决策既数据驱动又经实践检验。最终目标是选择最适合业务场景的模型,而非盲目追求流行模型。

  • OpenAI CEO:GPT-6将具备个性化记忆 记住用户偏好习惯

    OpenAI的首席执行官萨姆奥尔特曼(Sam Altman)在近日的一次专访中,透露了下一代大模GPT-6的最新进展。他表示,GPT-6 的开发正在积极推进中,其发布节奏将比从GPT-4到GPT-5的周期更快。 奥尔特曼特别强调,GPT-6将不再局限于单纯回答问题,而是朝着与用户深度适配”的方向演进。他举例描述

  • 博士水平的GPT-5依然翻车 OpenAI奥特曼:AGI已失去意义

    上周末OpenAI公司发布了传闻已久的GPT-5大模型,号称迄今为止最先进的人工智能模型,具备博士级别的智能水平。 GPT-5发布之后在多个榜单上确实刷榜了,包括编程、数学等,总计拿到了25个榜单的第一,评分表现很震撼。 然而上线之后,GPT-5的实际表现引发质疑,跑分第一不代表实际体验第一,甚至被不少用户认为表现倒退了,反应也变慢,这可能是OpenAI翻车最快的旗舰大�

  • 当GPT-5遇上Gemini 2.5,谁更适合你的业务?这份对比报告说了算

    某跨境电商CTO复盘会上展示:GPT-5 Standard处理百万级商品描述时,费用比Gemini 2.5 Flash-Lite高35%,响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试,提供透明价格拆解和性能雷达图,帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%,而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价,生成定制化决策报告,用数据替代经验主义,提升技术选型效率。

  • 豆包1.5 Vision Lite 对比 GPT-5-min,谁更适合你?实测AI模型选型利器|AIBase

    文章探讨了企业选择AI大模型时面临的实际决策难题,指出单纯比较学术参数无法满足业务需求。AIBase模型对比平台(https://model.aibase.cn/compare)通过三大核心价值解决痛点:1)聚焦业务场景而非参数堆砌,突出价格、语言支持、上下文长度等实用维度;2)透明化成本计算,标注长文本溢价规则和多模态附加费;3)一键生成对比报告。平台特别强调中文场景的特殊性(如豆包1.5在中文处理成本的优势),并揭示厂商宣传中容易忽略的隐藏成本(如GPT-5-min超5000字符的30%溢价)。典型电商客服案例显示,需综合中文理解、多模态、性价比等维度决策,最终选择取决于具体业务需求而非绝对性能排名。

  • GPT-5横空出世:API最低0.40美元,人人享“博士级智慧”

    OpenAI正式发布新一代旗舰模型GPT-5,CEO奥尔特曼称其智能水平如同与博士级专家对话。该模型在写作、编码、医疗等核心领域表现突出,幻觉率大幅降低80%,输出token数量减少50%-80%。GPT-5系列包含多个版本,其中GPT-5nano的API价格低至0.4美元/百万token,极具竞争力。基准测试显示GPT-5以68分位居榜首,超越Grok-4等对手。OpenAI同时宣布向所有用户开放使用,并计划升级语音模式,探索

  • 因为GPT-5,这群人决定在Reddit上起义。

    ​这个周末,对OpenAI的抗诉,好像从未如此热闹过。 起因自然还是因为GPT-5。 OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。

今日大家都在搜的词: