首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

AI视野:OpenAI官宣奥特曼回归;元象推出3D拍摄与混合编辑插件工具;百度灵医大模型将接入孚宝机器人;together.ai融资7.3亿元

2023-11-30 15:05 · 稿源:站长之家

📰🤖📢AI新鲜事

OpenAI官宣Sam Altman回归担任CEO

OpenAI正式宣布Sam Altman回归担任CEO,Mira Murati将回到CTO职位,新的董事会由Bret Taylor、Larry Summers和Adam D'Angelo组成。Altman表示对公司使命成功的乐观,并强调未来将专注于推进研究计划和安全工作,改进产品,为客户提供服务,并建立多元化董事会。

【AiBase提要:】

👉 Altman回归CEO职位: OpenAI宣布共同创始人Sam Altman回归担任CEO一职。

👉 新董事会成员揭晓: 新董事会由Bret Taylor(董事长)、Larry Summers和Adam D'Angelo组成。

👉 未来发展重心: 公司将专注于推进研究计划、安全工作,改进产品,服务客户,并构建多元化董事会。

亚马逊推出 Titan 图像生成器:内置保护机制

亚马逊在re:Invent大会上发布了Titan图像生成器,作为AWS Bedrock AI服务的一部分,专注于企业市场,具备内置保护机制,提供法律保护选择。

【AiBase提要:】

💡 亚马逊推出Titan图像生成器,突显人工智能图像生成领域进展,着重于为企业市场提供原创图像生成和编辑服务。

🏢 Titan定位为开发者工具,与消费者导向图像生成器不同,内置保护机制防范潜在偏见,为所有图像加入不可见水印以标识其为人工智能生成。

⚙️ 除图像生成器外,亚马逊还推出其他Titan模型,涵盖轻量级文本生成到支持对话式聊天应用的各类任务。

百度灵医大模型将接入孚宝机器人

百度灵医智惠与孚宝智能合作,将全面接入孚宝机器人产品,推动医疗康养机器人的技术创新和服务升级,为智慧康养产业注入创新动能。

【AiBase提要:】

🤖 技术融合服务升级: 百度灵医大模型将全面接入孚宝机器人,为医疗康养服务机器人提供技术支持,推动服务升级。

🏥 解决方案联合落地: 双方将在医院、政府、药械、居家等场景中实现解决方案的联合落地,推动行业创新。

🚀 大模型应用拓展: 百度灵医大模型的全面接入将为孚宝机器人用户带来更便捷的服务,促进智慧康养产业创新。

Phind发布V7版本,性能超越GPT-4

Phind最新V7版本在性能上超越GPT-4,运行效率提升5倍,支持中文和16K超长上下文,是一款笑脸排名第一的纯代码模型。

【AiBase提要:】

🚀 Phind V7性能超越GPT-4,运行效率提升5倍,支持中文和16K超长上下文。

💻 基于开源代码模型CodeLlama-34B V2,击败GPT-4,笑脸排名第一

⚡ Phind V7运行速度快5倍,每秒处理100tokens,支持多轮深度对话。

DeepMind发现ChatGPT存在重大安全漏洞

Google DeepMind的研究团队发现,通过简单的查询攻击方法,可以从ChatGPT中泄露大约几MB的训练数据,成本仅约200美元,引发社交网络哗然。

【AiBase提要:】

😱 简单的查询攻击可导致ChatGPT泄露数MB训练数据,成本仅200美元。

🕵️‍♂️ 研究团队成功攻击生产级模型,即使对齐设定也无法阻止训练数据泄露。

🛡️ 开发者被警示加强模型隐私性和防护,进行全面测试以确保安全性。

可口可乐将继续推AI生成定制节日贺卡服务

可口可乐计划在假期季通过其AI平台“Create Real Magic”推出定制化节日贺卡,强调互动性,同时探索多元体验以连接品牌与文化。

【AiBase提要:】

🖼️ 创新AI平台: 可口可乐通过"Create Real Magic"平台推出定制化假日贺卡,吸引年轻科技爱好者,注重互动性。

🌐 多元体验: 公司除了专注于AI,还通过Sphere、游戏和音乐等体验超越传统广告,连接品牌与文化。

🚀 品牌建设: 通过提供免费工具,并以用户创作登上广告牌为奖励,可口可乐致力于加强与消费者的关系,塑造品牌情感。

苹果前员工创立新AI公司

三位曾在苹果工作的前员工成立了名为“软件应用有限公司”的新创企业,旨在通过生成式人工智能重新定义桌面计算机的使用体验,计划在未来一年内招聘多达10名员工,并已从投资方筹集了650万美元。

【AiBase提要:】

🖥️ 三位前苹果员工创立新公司,名为“软件应用有限公司”,计划通过生成式人工智能改变桌面计算机的使用方式。

💡 公司首席执行官 Ari Weinstein 表示,他们的目标是通过语言模型和人工智能创建新型软件,让普通用户能够更灵活地使用计算机解决问题。

💰 在尚未推出产品之前,该创业团队已经从投资方筹集了650万美元,计划在未来一年内招聘多达10名员工,包括设计师和机器学习专家。

DeepMind通过深度学习框架GNoME成功发现220万种新材料

通过GNoME框架,Google DeepMind的科学家们成功预测和发现了超过220万种新材料,拓展了人类技术可行材料的范围,展示了深度学习在材料科学中的潜力。

【AiBase提要:】

🧠 深度学习创新: Google DeepMind的GNoME框架结合图神经网络和主动学习方法,成功预测并发现了220万种新材料。

💡 技术进步关键: 这一发现不仅拓展了已知材料的前沿,还展示了机器学习在材料科学中解决重大挑战的可能性。

🌐 潜在影响: 新材料的发现不仅为技术创新提供原料,还推动了对材料行为的进一步理解,有望解决能源存储等领域的社会挑战。

开源生成式AI初创平台together.ai融资7.3亿元

生成式AI初创平台Together AI融资7.3亿元,强调开源在大模型领域的重要性,发布备受好评的开源产品,与多家公司合作在欧美地区运营云计算中心,取得令人瞩目的发展成就。

【AiBase提要:】

🚀 融资成就:Together AI成功在A轮融资中募集7.3亿元人民币,由凯鹏华盈领投,英伟达等多家公司跟投。

🌐 开源推动:平台强调开源在大模型领域的重要性,发布类ChatGPT模型和大语言模型训练加速器等备受好评的开源产品。

☁️ 生态合作扩展:除了融资和开源产品,Together AI还与英伟达、Crusoe Cloud、Vultr等合作,在欧美地区运营云计算中心,为生成式AI初创企业提供服务,取得显著成绩。

🤖📱💼AI应用

元象推出3D拍摄与混合编辑插件工具

元象发布全新免费插件XVERSE3D-GS UE Plugin,可通过手机拍摄生成高清3D空间,并在虚幻引擎中进行混合编辑,开创全新3D体验。

image.png

下载地址:

github.com/xverse-engine/XV3DGS-UEPlugin

在线体验地址:

uat-h5.xverse.cn/3DGS/dev/3DGS/check.html

【AiBase提要:】

🚀 全新插件发布: 元象推出XVERSE3D-GS UE Plugin,支持手机拍摄生成高清3D空间,免费提供给所有用户使用。

🌐 多端呈现与互动: 插件具备多端实时浏览和分享功能,支持漫游、俯瞰等多种交互方式,丰富用户体验。

🎨 虚实融合编辑: 创作者可在虚幻引擎中进行混合编辑,添加虚拟角色、动画、灯光等元素,创造虚实融合的全新3D体验。

微软Paint新增Cocreator按钮,基于DALL-E文字转图片技术

微软在Windows11的Paint应用中引入了Cocreator图像生成AI功能,使用OpenAI的DALL-E3模型,不再限于Windows Insider用户。用户可以通过输入描述并选择生成的图像,该功能不仅在Paint中可用,还整合到Bing搜索聊天机器人和Copilot AI助手中。

image.png

【AiBase提要:】

🖌 微软Paint新增Cocreator按钮,使用DALL-E3模型为用户提供文字转图功能。

🤖 Cocreator按钮不再仅限于Windows Insider,所有用户都能在Microsoft Paint中使用这一AI生成技术。

🚀 微软整合DALL-E3的文图生成功能,不仅应用于Paint,还包括Bing搜索聊天机器人和Copilot AI助手。

即时音频转录工具InsanelyFastWhisper 支持人声分割

InsanelyFastWhisper是一款命令行音频转录工具,声称在100秒内可转录2.5小时音频,具备自动转录和说话人分割功能,提高转录效率。

image.png

项目地址:https://github.com/Vaibhavs10/insanely-fast-whisper

【AiBase提要:】

🚀 InsanelyFastWhisper是音频转录工具,声称在100秒内可转录2.5小时音频。

🎙️ 工具具备自动转录和说话人分割功能,可识别不同说话人,提高工作效率。

⚡️ 高效且强大,适用于处理大量音频文件,节省时间和劳动力。

🤖📈💻💡大模型动态

Perplexity AI 发布 PPLX 在线语言模型

Perplexity AI发布PPLX在线语言模型,结合网络索引和实时信息,可能颠覆谷歌搜索领域,提供更准确、实用、和最新的搜索结果。

截屏2023-11-30 上午10.24.41.png

【AiBase提要:】

🚀 技术突破: Perplexity发布PPLX在线语言模型,与传统搜索引擎不同,结合网络索引和实时信息,提供更强大的搜索能力。

🔄 超越竞争对手: 与ChatGPT等模型相比,Perplexity的PPLX在线语言模型在准确性和新鲜度方面表现更优,可能改变搜索引擎的使用体验。

💻 商业模式: Perplexity提供API,个人和组织可通过其网站使用新的PPLX在线语言模型,但需要支付费用,展望未来AI助手与用户实时对话成为搜索主流。

深度求索开源DeepSeek LLM67B大模型

深度求索发布了完全开源的67B大模型DeepSeek LLM67B,在公开评测中表现良好,尤其在推理、数学和编程能力方面脱颖而出。

Hugging Face 首页:https://huggingface.co/deepseek-ai

GitHub 仓库:https://github.com/deepseek-ai/DeepSeek-LLM

【AiBase提要:】

🚀 开源大模型: DeepSeek发布全开源67B模型,无需申请,可免费商用,展现出在数学、编程等方面的卓越表现。

📊 多规模模型: 提供7B和67B两种规模的模型,并提供9个训练中途的模型checkpoints的下载,支持广泛应用。

🔗 资源链接: DeepSeek模型可通过chat.deepseek.com使用,同时在Hugging Face和GitHub上提供相关资源。

Hugging Face发布高度优化的Zephyr-7B迷你语言模型

Hugging Face推出经过蒸馏监督微调的Zephyr-7B迷你语言模型,基于Mistral7B开源模型,采用蒸馏直接偏好优化方法,在基准测试中超越Mistral7B,与拥有70亿参数的Llama-2媲美。

模型网址:https://huggingface.co/HuggingFaceH4/zephyr-7b-beta

【AiBase提要:】

🌐 Hugging Face发布Zephyr-7B,通过蒸馏监督微调方法,优化Mistral7B开源模型,取得显著性能提升。

⚙️ Zephyr-7B采用蒸馏直接偏好优化方法,利用教师模型输出作为偏好数据,极大缩短训练时间,降低资源需求。

🌐在基准测试中,Zephyr-7B超越Mistral7B,甚至可以与拥有70亿参数的Llama-2模型相媲美,标志着Hugging Face在迷你语言模型领域的技术进步。

👨‍💻💡🎯聚焦开发者

360度全景成像混合技术实现开源

360度全景图像技术难题迎来突破,研究人员设计出圆形混合技术,通过开源项目成功生成无缝全景图像,为旅游、房地产等领域带来新的可能性。

image.png

项目地址:https://github.com/archerfmy/sd-t2i-360panoimage

【AiBase提要:】

🌐 创新技术突破: 研究人员设计圆形混合技术,成功实现从文本和单张图像生成无缝360度全景图像。

🔄 无缝全景效果优势: 圆形混合方法整合零散信息,以更简单高效的方式生成全景图像,避免拼接处的不连贯和缺陷。

🌍 广泛应用前景: 技术在旅游、房地产、虚拟现实等领域具有重要应用价值,提供更全面的地点了解,帮助用户做出更准确的决策。

举报

  • 相关推荐
  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • AI日报:OpenAI发布浏览器Atlas;通义Qwen3-VL新增2B、32B两个模型尺寸;百川发布循环证据增强大模型

    本文汇总AI领域最新动态:OpenAI推出集成ChatGPT的Atlas浏览器,实现多任务自主处理;阿里通义千问新增2B/32B视觉语言模型,手机可流畅运行;谷歌AI Studio升级Vibe Coding功能,简化应用开发流程;百川发布医疗大模型M2Plus,通过循证推理降低误诊率;奇瑞墨甲机器人实现L3级技术突破,计划多行业应用;YouTube推出AI肖像识别工具,打击虚假内容;三星宣布2026年推出AI眼镜,融合AR与语音助手;Claude客户端更新,支持截图分析和语音交互功能。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • AI日报:Sora正式登陆Android;网易云音乐推AI调音大师;谷歌将推Nano Banana2

    本期AI日报聚焦多领域突破:OpenAI视频应用Sora登陆安卓平台并引入付费角色功能;网易云音乐推出AI调音大师实现智能音效适配;字节跳动高薪布局人形机器人赛道;谷歌Gemini平台将升级图像生成技术;llama.cpp实现多模态革命;特斯拉秘密实验室通过行为数据训练机器人;上海首例AI著作权案宣判保护原创;微软推出自研图像生成器MAI-Image-1,在创意效率与质量间取得平衡。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • Sora 2生成已故名人视频引亲属不满 OpenAI回应:重视反馈 将迅速纠正失误

    OpenAI 近日推出的 Sora 2 模型引发广泛关注,其默认禁止生成在世公众人物视频,用户纷纷尝试生成各类创意内容。然而,创作者与观众很快发现这一限制存在明显漏洞该模型允许生成已故公众人物的影像,从而在伦理层面引发争议。 社交媒体上已涌现大量AI复活”名人的案例,例如李小龙主持DJ现场、迈克尔杰克逊表演单口喜剧等。尽管OpenAI在每段生成视频上添加动态水印,�

  • 广东夫妻像双胞胎 网友建议查下DNA:当事人称刚认识时并不像

    ​近日,广东一对夫妇在社交媒体上迅速走红,原因竟是他们长得极为相像,仿佛是“复制粘贴”出来的一般,不少网友惊叹:“这才是真夫妻相”“简直是双胞胎”,甚至有人打趣道:“远远看还以为是一对双胞胎出门,走近了才发现是夫妻俩!” 妻子梁女士透露,她和丈夫是通过相亲认识的,起初就有不少人指出他们俩长得很像。随着两年共同生活的时光过去,两人竟愈发相

今日大家都在搜的词: