首页 > 业界 > 关键词  > GPT4最新资讯  > 正文

AI日报:GPT-4-Turbo正式版自带读图能力;Gemini1.5Pro开放API;SD3将于4月中旬发布;抖音宫崎骏AI爆火

2024-04-10 15:04 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://top.aibase.com/

QQ截图20240410151413.png

📰🤖📢AI新鲜事

OpenAI发布GPT-4-Turbo 正式版 自带读图能力

image.png

【AiBase提要:】

⭐GPT-4-Turbo正式版全面开放,可通过“gpt-4-turbo”来使用此模型,最新版本为“gpt-4-turbo-2024-04-09”

⭐GPT-4-Turbo是带有视觉能力的模型,可处理128k上下文。

⭐ 价格不变,输入$10.00/100万tokens,输出$30.00/100万tokens,读图:最低 $0.00085/ 图

接口信息:https://platform.openai.com/docs/models/continuous-model-upgrades

价格信息:https://openai.com/pricing

相关限制:https://platform.openai.com/docs/guides/rate-limits/usage-tiers?context=tier-five

重磅!GPT-4API全面开放使用

【AiBase提要:】

⚙️ GPT-4具备更强的创造性,支持生成、编辑并共同迭代创意和技术写作任务。

🔍 GPT-4有更长的上下文处理能力,适用于创建长格式内容、扩展对话以及文档搜索和分析等场景。

🏢 企业如摩根士丹利已开始应用GPT-4,将其嵌入内部机器人,帮助财务人员查找资料并节省时间。

API详细使用说明地址:https://platform.openai.com/docs/guides/gpt

谷歌宣布Gemini1.5Pro开放API 新增多项功能

image.png

【AiBase提要:】

🎵 Gemini1.5Pro引入了原生音频理解能力,不需先转换为文本。

📄 Gemini1.5Pro扩展了输入模态范围,支持视频内容处理。

💻 Gemini API改进,加入系统指令引导模型响应和JSON模式。

详情点此查看:

https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html

音频理解能力:

https://github.com/google-gemini/cookbook/blob/main/quickstarts/Audio.ipynb

SD3将于4月中旬发布!预计会有6种规模的模型

QQ截图20240410102202.png

【AiBase提要:】

⭐ SD3计划在四月中旬正式发布,已发布两篇关于SD3和SD3Turbo的论文

⭐ SD3可能拥有多达6种不同规模的模型,满足不同需求。

⭐ SD3具有80亿参数,适用于RTX4090,生成1024x1024图像需34秒。

SD3论文:https://arxiv.org/abs/2403.12015

SD3Turbo论文:https://arxiv.org/abs/2403.03206

更多SD3制作图像点此查看:https://sd3.art/

性能超H100!英特尔发布新一代人工智能芯片Gaudi3压力给到英伟达!

1.jpg

【AiBase提要:】

⭐ Gaudi3性能超英伟达H100,是最强AI芯片之一

⭐ Gaudi3能效是英伟达芯片的两倍多,速度也快

⭐ Gaudi3采用先进5nm工艺,配备128GB HBM2e内存

详细:

https://www.intel.com/content/www/us/en/newsroom/news/vision-2024-gaudi-3-ai-accelerator.html#gs.7q25hh

Poe为AI机器人创建者引入了按消息定价的收入模式

【AiBase提要:】

⭐ Poe 推出了一种信息收费的收入模式

⭐ 新收入模式将有助于激励开发更多种类的机器人

⭐ 创作者可以为他们的机器人设置每条消息的价格,赚取收入。

刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

【AiBase提要:】

🌟 Mistral AI再次发布磁力链,解禁281GB的8x22B MoE模型。

🌟 Mistral AI靠一条磁力链掀起AI社区热潮。

🌟 新的MoE模型支持多语言、性能强大,旗舰版直接对标GPT-4。

详情:https://www.chinaz.com/2024/0410/1609213.shtml

抖音AI特效一键生成宫崎骏画风爆火

image.png

【AiBase提要:】

⭐ 电影宣传团队与抖音合作推出宫崎骏动画风格的AI特效,吸引200万用户参与。

⭐ 使用特效引发争议,支持者认为向宫崎骏致敬,反对者则认为违背大师意愿。

⭐ 争议中指出宫崎骏对AI动画技术的抵制,但实际视频并非AI技术。

详情:https://www.chinaz.com/2024/0409/1609015.shtml

Suno音乐攻占B站鬼畜区 “钢门松弛”成最热门题材

image.png

【AiBase提要:】

🎶 歌曲“你的钢门比较松弛”在B站引发热潮,吸引数百万网友关注。

🎤 AI音乐走红,Suno软件领衔鬼畜音乐创作,获得突破性成功。

📈 AI音乐评论区氛围和谐,网友以幽默和调侃方式互动,展现创意风采。

详情:https://www.chinaz.com/2024/0409/1608982.shtml

苹果公司发布新型机器学习语言模型MLLLLM Ferret-UI 用于理解应用 UI 界面

image.png

【AiBase提要:】

⭐️ Ferret-UI是专为移动UI屏幕设计的MLLLM,具备引用、定位和推理能力。

⭐️ 采用“任何分辨率”技术,提高模型对小型对象的理解精度。

⭐️ Ferret-UI通过对话能力在详细描述、交互对话和功能推断等任务中表现突出。

论文地址:https://arxiv.org/pdf/2404.05719.pdf

马云内网发声:肯定阿里变革一年成效 称 AI 时代刚刚到来

【AiBase提要:】

⭐ 马云肯定阿里新管理层勇气,称公司重回健康成长轨道

⭐ 马云认为阿里最核心变化是重回客户价值轨道

⭐ 马云预测互联网行业未来三至五年将发生翻天覆地变化,AI时代正当其时

🤖📱💼AI应用

百度网盘推出AI创意生成工具“超能画布”

微信截图_20240410111214.png

【AiBase提要:】

⭐ 独特的图像大模型和智能人脸融合算法

⭐ 提供丰富的背景、服装切换选项

⭐ 可对人物表情、发色进行局部重绘

体验地址:https://top.aibase.com/tool/chaonenghuabu

现阶段有效白嫖(免登录) GPT-3.5的项目

image.png

1⃣Aurora https://github.com/aurora-develop/aurora

(各种花式白嫖,支持 Render/Vercel 等一键部署)

2⃣ChatGPT https://github.com/PawanOsman/ChatGPT

(支持 Docker & Android,很稳定)

3⃣FreeGPT35https://github.com/missuo/FreeGPT35

(参数多,支持 Nginx 反向代理)

谷歌将推全新AI视频工具Google Vids 集多种功能一体

1.png

【AiBase提要:】

📱 Google Vids集多种功能于一体,帮助用户轻松创作故事板。

🖼️ AI技术协助编辑内容,选择适合的场景、图片和音乐。

🎙️ 用户可为视频加上配音,提升视频个性化和专业度。

AI也可以生成延时视频了 MagicTime输入文本即可生成植物生长视频

image.png

【AiBase提要:】

⭐️MagicTime模型专注于生成变形时间延迟视频

⭐️生成的视频符合现实世界物理规律,可以生成比较自然的植物生长过程视频。

⭐️对提示的理解更准确,生成的质量也比较高

项目演示:https://top.aibase.com/tool/magictime

代码:https://github.com/PKU-YuanGroup/MagicTime

DreamWalk:实现对图像生成风格和内容的精细控制

image.png

【AiBase提要:】

⭐ 用户可以更加自由地决定图像中哪部分应该更加强烈地体现某种风格

⭐ DreamWalk支持在不同风格间进行平滑过渡,保证生成图像更加和谐统一

⭐ 可将现实世界图像转换为特定风格的艺术作品,满足用户对多样化图像风格的需求

项目演示:https://top.aibase.com/tool/dreamwalk

论文:https://arxiv.org/pdf/2404.03145.pdf

金山办公WPS365升级 推出 WPS AI 企业版和 WPS 协作

微信截图_20240409173433.png

【AiBase提要:】

⭐️ WPS365整合文档、AI和协作能力,实现一站式AI办公。

⭐️ WPS AI企业版降低使用大模型门槛,提供智能创作与数据分析功能。

⭐️ WPS365模式让用户通过一个产品高效完成所有工作,实现办公新质生产力。

——————

每日midjourney prompt:电商模特——比基尼

A Beautiful Chinese Girl with long dark hair,Wearing a green silk camisole shirt and a flowing skirt, sitting on rocks by the ocean, eyes closed, serene expression, realistic, photorealistic, detailed,8k --ar3:4--q2--s750

2_1712731778423_ai2023_A_Beautiful_Chinese_Girl_with_long_dark_hairWearing_a_gr_640afd7f-fbad-4f5f-821f-e248f1c0cf48.png

一个美丽的中国女孩,留着一头乌黑的长发,穿着绿色丝绸背心和飘逸的裙子,坐在海边的岩石上,闭着眼睛,表情安详,逼真,细节,8k

举报

  • 相关推荐
  • OpenAI最强模型GPT-5.4重磅发布 首次支持原生操控电脑 超越人类

    今日,OpenAI正式发布全新大模型GPT-5.4,号称目前能力最强、效率最高的专业工作前沿模型。 相比此前的GPT-5.2,GPT-5.4在推理能力、编程能力以及处理专业办公任务方面都有明显提升,尤其是在电子表格、PPT等复杂办公场景中的表现更加出色。 此次更新带来了两个版本:更擅长复杂推理任务的GPT-5.4 Thinking,以及性能更强、面向企业高端需求的GPT-5.4 Pro。 其中,GPT-5.4 Thinking主�

  • GPT-5.4:OpenAI做了个Kimi K2.5 +MiniMax M2.5?

    为了更好的追赶Claude,OpenAI带来了能力“N合1”的统一模型GPT-5.4,而看完这个模型的各种介绍和能力展示,你会发现它满满都是Kimi K2.5和MiniMax M2.5这两个在agent上卷到疯的开源模型的影子。 融合了多种agent能力的all in one模型 3月5日,OpenAI 正式发布 GPT-5.4。和过去那种“模型更强一点”的更新不同,这次发布的重点非常明确:把 AI 从聊天助手,进一步推向真正能交付专业工作的�

  • AI日报:腾讯内测QClaw一键启动包;小红书新款AI编辑模型开源;OpenClaw正式支持 GPT-5.4

    本期AI日报聚焦多项AI领域新动态:腾讯内测QClaw一键启动包,降低开源智能体使用门槛;火山引擎发布ArkClaw云平台,优化AI Agent应用痛点;小红书开源FireRed-Image-Edit v1.1图像编辑模型,性能显著提升;AI技能qiaomu-mondo-poster-design可一键生成大师级海报;阿里达摩院发布MAOSS模型,利用AI筛查脂肪肝,检出率翻倍;OpenClaw发布重大更新,全面支持GPT-5.4;OpenAI再次推迟“成人模式”上线,优先提升AI智能水平;OpenClaw“小龙虾”能力排行榜出炉,展示各大模型真实编码战力。

  • AI日报:小米发布Agent产品Xiaomi miclaw;OpenAI 发布 GPT-5.4系列;微软宣布必应视频全面接入Sora2模型

    本期AI日报涵盖多项重要动态:小米发布首款移动端Agent产品Xiaomi miclaw,基于自研MiMo大模型,旨在实现智能终端自动化交互。OpenAI推出GPT-5.4系列模型,包括标准版、推理版和高性能版,上下文窗口达百万级,在金融和法律领域表现优异。微软宣布必应视频创作者全面接入Sora2模型,提供免费高质量视频生成服务。Roblox推出AI实时改写功能,将违规内容自动转为礼貌合规语言。3D生成模型公司VAST获5000万美元融资,由阿里巴巴领投,将用于构建UGC互动生态。携程下线自动调价工具,推动酒店行业转向服务竞争。陈天桥九年后首度露面,透露正投入20亿美元研发“发现式AI”。阿里巴巴澄清千问团队集体离职传闻,称团队稳定,服务正常。

  • AI日报:OpenAI上线 GPT-5.3 Instant;通义千问负责人林俊旸宣布离职;谷歌发布 Gemini 3.1 Flash-Lite

    本期AI日报聚焦行业动态:OpenAI紧急上线GPT-5.3 Instant,重点解决“爹味说教”问题;Anthropic推出Claude Code语音编程模式,提升开发效率。马云带领阿里与蚂蚁核心层访问云谷学校,探讨AI浪潮下的教育变革。AReaL v1.0框架发布,降低智能体强化学习开发门槛。阶跃星辰开源Step3.5Flash模型,参数达1960亿。阿里通义千问负责人林俊旸离职,反映大模型人才高频流动趋势。谷歌发布Gemini

  • GPT4Free官网体验入口 GPT4和GPT4 Vision AI免费在线使用地址

    GPT4Free是一个GPTAI和ChatGPT的在线Playground,无需API、登录或限制。您可以尽情探索GPT3.5Turbo、GPT4和GPT4Vision等最新模型。

  • GPT4o生成的烂自拍,反而比我们更真实。

    文章探讨了GPT-4o通过简单Prompt生成的"不完美"照片引发热潮的现象。这些刻意追求平凡、模糊、构图混乱的照片,反而因其"不完美"带来了前所未有的真实感。作者指出,在社交媒体充斥精修照片的时代,这种未经修饰的"生活切片"恰恰捕捉了人类最熟悉的真实瞬间。通过分析911事件经典照片《坠落的人》,文章进一步论证了真实往往存在于未经表演的偶�

  • GPT5上线大翻车!用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

    OpenAI发布最强AI模型GPT-5,但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降,且官方突然下架GPT-4o等8个旧模型,导致付费用户抗议。部分用户对旧版产生情感依赖,认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升,但交互体验明显退步。CEO承认低估用户对旧版的喜爱,承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减,面临数据质量和算力成本限制。总体而言,GPT-5在技术指标进步的同时,牺牲了情感交互体验。

  • OpenAI将修复GPT4变懒问题 将进行彻底的离线评估

    OpenAI宣布将修复GPT-4变懒问题,并解释了其变懒的原因。上周OpenAI收到了用户的投诉,称在使用ChatGPT或GPT-4API时遇到了回应速度慢、敷衍回答、拒绝回答、中断会话等问题。这一系列问题使得OpenAI在维护和更新其模型上面临一些挑战。

  • 何小鹏盛赞GPT4:既是趋势又在眼前又可产生颠覆

    针对今日推出的GPT-4,小鹏汽车董事长何小鹏表示:“GPT是最近数年的全新技术浪潮中,包括元宇宙,区块链,Web3中等中我唯一觉得既是趋势又在眼前又可产生颠覆的。”据悉,GPT-4是一个多模态大模型,在各种专业和学术基准上可以表现出人类水平。GPT-4的文字输入限制也提升至2.5万字,且对于英语以外的语种支持有更多优化。

今日大家都在搜的词: