首页 > 业界 > 关键词  > 人工智能最新资讯  > 正文

每周AI大事件 | 微软全面开放BingChat、AI引发大裁员、OpenAI已不使用客户数据

2023-05-06 09:19 · 稿源:站长之家

欢迎来到站长之家的[每周AI大事件],这里记录了过去一周值得关注的AI领域相关内容,帮助大家更好地了解人工智能领域的动态和发展风向。

机器人 客服

Part1动态

[国内要闻]

科大讯飞发布“星火”认知大模型

5月6日,科大讯飞在安徽合肥滨湖国际会展中心召开讯飞星火认知大模型成果发布会,科大讯飞将发布讯飞星火认知大模型。除了发布“讯飞星火认知大模型”技术成果之外,星火认知大模型在公司现有产品上的商业应用成果亦将同步发布,包括:讯飞AI学习机、讯飞听见、讯飞智能办公本、讯飞智能座舱、讯飞开放平台。

网易有道发布 AI 口语老师剧透视频

网易有道官方视频号发布了基于「子曰」大模型开发的 AI 口语老师剧透视频。网易有道 AI 口语老师能提供多种练习场景,同时会根据用户需求扮演多种角色,进而引导用户进行多轮对话、解决长期困扰「开口难」的问题。

学而思自主研发数学大模型MathGPT

学而思正在自主研发一款名为MathGPT的数学大模型,该研发项目面向全球数学爱好者和科研机构,以数学领域的解题和讲题算法为核心。目前,该项目已经取得阶段性成果,并计划于年内推出基于该自研大模型的产品级应用。

文心一言已完成4次技术升级

在百度新使命六周年暨百度骄傲颁奖典礼上,李彦宏谈透露,文心一言内测一个多月便完成了4次大的技术升级,大模型推理成本已经降到了原来的十分之一,或者说推理性能提升近10倍。

FF91将集成ChatGPT、GPT-4等模型

FF表示,公司将其人工智能技术与ChatGPT、GPT-4等高级模型以及OpenAI和微软等公司的其他模型进行整合,推出了FF的生成式AI产品组。

百度文库接入文心一言

百度文库开启“AI文档助手”功能内测。据了解,该功能已内测接入百度“文心一言”,将支持多轮对话,同时可为用户提供活动方案、标书、研究报告、讲话稿等文档内容辅助写作功能,基本覆盖了所有办公、学习应用场景。

[国际要闻]

Bing聊天:将支持使用100种语言生成图像

Bing宣布,将在未来几周测试一些新功能,这些功能可能会进行临时试验。包括了优化聊天答案格式,以及支持使用100种语言生成图像。

美国白宫推出首个AI监管计划

根据白宫公告,美国国家科学基金会计划拨款1.4亿美元,用于启动7所新的国家人工智能研究院,推进人工智能技术在气候、农业、能源、公共卫生、教育和网络安全等关键领域的研发突破。

微软全面开放BingChat:无需等待答案图文并茂

微软宣布向所有人开放其BingGPT-4聊天机器人,无需再加入候补名单等待。更重要的是,支持100种语言多模态输出、持续聊天且记录可随时导出、类ChatGPT插件功能将推出。

亚马逊计划AI为商家生成照片和视频广告

亚马逊公司发言人证实,正在建立一个团队,研究人工智能工具,为商家生成照片和视频,用于其平台上的广告活动,这些努力可能有助于其广告业务的多样化。

三星禁止ChatGPT、Bard、BingAI

出于安全考虑,三星电子已禁止员工使用ChatGPT、GoogleBard和Bing等流行的生成式AI工具,正准备推出内部工具。三星电子的新规禁止在公司所属的电脑、平板电脑、电话及内部网络使用生成式AI系统,但不影响出售给消费者的设备,由用户自行决定。

付费图库巨头竟鼓励用户拿AI做图

图库网站的Shutterstock和OpenAI一块搞了个AI图片生成器,并欢迎用户积极使用。对数据集做贡献的人,还提供补偿!在官网中,Shutterstock便展示了一些已经由AI生成的照片。

[OpenAI相关]

OpenAI再度融资估值已达2000亿元

ChatGPT背后的初创公司OpenAI完成103亿美元融资,估值达到270亿-290亿美元(约合人民币1900亿-2000亿元)。

OpenAI称已不使用客户数据训练模型

OpenAI的CEO阿尔特曼表示,已经有一段时间不再使用付费客户的数据来训练人工智能(AI)大语言模型。阿尔特曼表示:“用户希望我们不要使用他们的数据进行训练,因此我们已经改变了计划,并将来不再这样做。”

OpenAI未来尝试筹集1000亿美元开发更先进的AI

首席执行官SamAltman私下表示,OpenAI可能会在未来几年尝试筹集多达1000亿美元的资金,以实现其开发足够先进的通用人工智能的目标,以提高自身的能力。

OpenAI威胁将起诉免费GPT-4聊天机器人

一位开发者创建了一个名为GPT4free的项目,利用一些付费网站的API,间接地调用GPT-4的服务,让用户免费体验GPT-4聊天机器人服务。对此,OpenAI要求他在五天内删除Github项目,否则将采取法律行动。OpenAI公司认为,开发者侵犯了他们的版权和商业利益。

Part2热门产品

MidjourneyV5.1:提示词设置更简单、禁用词审核更智能

Midjourney发布了V5.1版本,旨在通过简单的提示提供更好的结果,5.1版中的RAW模式提供了更多的创作自由,同时仍然提供高质量的图像。该公司还引入了一种新的审核系统,可以在提示的上下文中评估单词,取代以前的单词屏蔽系统。

联发科推出繁体中文AI多语言模型BLOOM-zh

BLOOM-zh起源于BigScience于2022年推出的开源BLOOM模型。从已发布的模型开始,联发科对BLOOM的预训练进行了额外的繁体中文和英文74亿个token的扩展,涵盖新闻等多个领域文章、书籍、百科全书、教育材料以及口语。

渐进式3D生成框架“DreamFace”:5分钟生成漫威3D数字人

DreamFace是文本指导的渐进式3D生成框架,结合了视觉-语言模型、隐式扩散模型和基于物理的材质扩散技术,可以生成符合计算机图形制作标准的3D资产。项目网站:https://sites.google.com/view/dreamface

苹果新模型StyleGAN2:一张照片生成3D头像

随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。这是苹果的最新黑科技生成框架FaceLit。正如其名,FaceLit的特色就是可以将人脸“点亮”。进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。

画一笔AI画整张图,一个脚本搞定

现在用AI画画,完整草图都不需要了。每一笔落下,AI都会实时交上“新作业”,细节、颜色、画布空白,它都自动补全,还能通过提示词来控制生成图像的内容和风格。这都是靠一个Python脚本实现。通过构建一个画布和一个图像生成框,然后把每次落笔后的草图发送给Automatic1111的API接口,这样就能基于StableDiffusion和ControlNet的能力作画了。

Part3观点

李彦宏内部讲话谈大模型唯算力论

李彦宏称新时代需养成AI原住民思维,未来要用“AI原生应用”的思维方式和理念,重构百度每一个产品。此外,李彦宏还谈到了大模型唯算力论,“算力可以买来,创新能力是买不来的”,算力不能保证在通用人工智能技术上领先,必须依靠创新能力自建。

库克:应用生成式AI技术「深思熟虑非常重要」

库克表示人工智能的潜力「非常有趣」,但指出在如何使用该技术方面「深思熟虑非常重要」苹果已经在其多项产品和服务中整合了人工智能和机器学习,并指出了跌倒检测、碰撞检测和AppleWatch上的心电图应用等功能。他补充说,苹果将继续在「非常周到的基础上」将人工智能融入其产品中。

DeepMindCEO:未来几年AI可能拥有「人类水平」的智能

谷歌DeepMind首席执行官DemisHassabis表示,通用人工智能(AGI)有望在几年内变成现实。人工智能能够与人类的智力相匹敌可能并不遥远。

“AI教父”:我为发展AI而后悔

有“AI教父”之称的杰弗里辛顿(GeoffreyHinton)称,他已经辞去了谷歌的工作,以便自己可以自由地谈论AI的风险。他已经在谷歌工作了十多年,成为该领域最受尊敬的人物之一。辛顿表示,他现在对自己一生从事的工作感到有些后悔。

微软首席科学官:AI需要是加速而不是暂停

针对马斯克等上千人呼吁暂停先进人工智能(AI)开发一事,微软首席科学官埃里克霍维茨(EricHorvitz)给出了相反的观点。他认为,AI真正需要的是加速投入,而不是暂停。

Part4深度

AI训练材料用完之日

据研究,过去10年来,AI训练数据集的增长速度远快于全世界的数据存量的增长速度。学者预测,大概三四年后,新的训练材料就会很难找。最迟三十年后,全世界所有材料都不够AI的训练。如果预测是正确的,就意味着,AI飞速发展不会持续很久。现在也许就是发展最快的阶段,然后就会开始放慢,等到本世纪中叶就会显著放慢,接近停滞。

AI引发大裁员

IBM宣布一个重磅消息:将暂停招聘人工智能可以胜任的岗位,将用AI取代7800个工作岗位。在AI大潮到来之际,大家只要做到一点:不要让自己成为“工具人”,一旦成为“工具人”,工具才会替代你的工作。

中国互联网大厂的“ChatGPT”追赶之旅现状

互联网大厂做生成式AI,目前的主要应用方向还是内部降本增效,至于面向C端(或中小B端)的大规模应用尚十分遥远。

不翻车不嫌累,月成本仅200元:AI主播攻占直播间

从成本来看,没有灯光、摄像等硬件投入,也少了主播培训、主播月薪等软投入,只用在前期缴纳一笔几千元的定制服务费,开播前输入文本便能完成直播。

举报

  • 相关推荐
  • 大家在看
  • Tonic Textual:安全数据湖,为生成式AI开发提供数据

    Tonic Textual 是全球首个为大型语言模型(LLMs)设计的Secure Data Lakehouse。它通过自动化流程,帮助企业从云存储中提取、治理、丰富和部署非结构化数据,以支持生成式AI的发展。该产品强调数据隐私保护,利用其专有的命名实体识别(NER)模型自动检测和去标识化敏感信息,同时通过数据合成保持数据的语义真实性。它支持多种数据格式,并通过AWS Marketplace、Google Cloud Marketplace和Snowflake Marketplace提供服务。

  • Outtloud:AI语音助手,将文档转换为自然语音

    Outtloud是一款AI语音助手,可以将用户文档或文本转换成自然流畅的高保真AI语音。它支持超过10种语言和口音,提供100多种AI高级人声。用户可以以高达4倍的速度听书,节省阅读时间,同时在驾驶、通勤、锻炼等任何时间任何地点进行学习。它还具备添加笔记和书签的功能,支持在焦点模式下高亮显示正在播放的段落,以便用户跟随阅读。

  • llama3v:基于llama3 8B的SOTA视觉模型

    llama3v是一个基于Llama3 8B和siglip-so400m的SOTA(State of the Art,即最先进技术)视觉模型。它是一个开源的VLLM(视觉语言多模态学习模型),在Huggingface上提供模型权重,支持快速本地推理,并发布了推理代码。该模型结合了图像识别和文本生成,通过添加投影层将图像特征映射到LLaMA嵌入空间,以提高模型对图像的理解能力。

  • Open LLM Leaderboard:开放的大型语言模型排行榜

    Open LLM Leaderboard是一个由Hugging Face提供的空间,旨在展示和比较各种大型语言模型的性能。它为开发者、研究人员和企业提供了一个平台,可以查看不同模型在特定任务上的表现,从而帮助用户选择最适合自己需求的模型。

  • OpenCompass Multi-modal Leaderboard:实时更新的多模态模型性能排行榜

    OpenCompass多模态排行榜是一个实时更新的平台,用于评估和排名不同的多模态模型(VLMs)。它通过8个多模态基准测试来计算模型的平均得分,并提供详细的性能数据。该平台仅包含开源的VLMs或公开可用的APIs,旨在帮助研究人员和开发者了解当前多模态模型的最新进展和性能表现。

  • I2VEdit:一种基于图像到视频扩散模型的视频编辑技术

    I2VEdit是一种创新的视频编辑技术,通过预训练的图像到视频模型,将单一帧的编辑扩展到整个视频。这项技术能够适应性地保持源视频的视觉和运动完整性,并有效处理全局编辑、局部编辑以及适度的形状变化,这是现有方法所不能实现的。I2VEdit的核心包括两个主要过程:粗略运动提取和外观细化,通过粗粒度注意力匹配进行精确调整。此外,还引入了跳过间隔策略,以减轻多个视频片段自动回归生成过程中的质量下降。实验结果表明,I2VEdit在细粒度视频编辑方面的优越性能,证明了其能够产生高质量、时间一致的输出。

  • Samba-1 Turbo:高效能的AI模型选择与应用平台

    Samba-1 Turbo是一个提供AI模型选择和应用的平台,它允许开发者通过免费的开发者推理服务来试用、比较和评估Samba-1中各种专家模型。此外,平台还提供一些构建在Samba-1之上的演示业务应用程序,以及开源语言专家SambaLingo。Samba-1 Turbo旨在为开发者提供强大的工具,以简化AI模型的集成和应用过程。

  • StreamV2V:实时视频到视频翻译的扩散模型

    StreamV2V是一个扩散模型,它通过用户提示实现了实时的视频到视频(V2V)翻译。与传统的批处理方法不同,StreamV2V采用流式处理方式,能够处理无限帧的视频。它的核心是维护一个特征库,该库存储了过去帧的信息。对于新进来的帧,StreamV2V通过扩展自注意力和直接特征融合技术,将相似的过去特征直接融合到输出中。特征库通过合并存储的和新的特征不断更新,保持紧凑且信息丰富。StreamV2V以其适应性和效率脱颖而出,无需微调即可与图像扩散模型无缝集成。

  • OpenCompass 2.0 Large Language Model Leaderboard:大型语言模型排行榜,实时评估模型性能。

    OpenCompass 2.0是一个专注于大型语言模型性能评估的平台。它使用多个闭源数据集进行多维度评估,为模型提供整体平均分和专业技能分数。该平台通过实时更新排行榜,帮助开发者和研究人员了解不同模型在语言、知识、推理、数学和编程等方面的性能表现。

  • 甲骨文AI协同平台:数字化甲骨文研究与共享平台

    甲骨文AI协同平台是一个专注于甲骨文研究的数字化平台,集成了甲骨文全信息著录库、甲骨文总字表、数字工具箱等资源,通过AI技术辅助甲骨文的释读、研究和教育传播。平台汇聚了众多博物馆、专家学者以及社会各界人士的共同努力,旨在推动甲骨文研究的深入发展和甲骨文化的传承。

  • Cantor:创新的多模态链式思维框架,提升视觉推理能力

    Cantor是一个多模态链式思维(CoT)框架,它通过感知决策架构,将视觉上下文获取与逻辑推理相结合,解决复杂的视觉推理任务。Cantor首先作为一个决策生成器,整合视觉输入来分析图像和问题,确保与实际情境更紧密的对齐。此外,Cantor利用大型语言模型(MLLMs)的高级认知功能,作为多面专家,推导出更高层次的信息,增强CoT生成过程。Cantor在两个复杂的视觉推理数据集上进行了广泛的实验,证明了所提出框架的有效性,无需微调或真实理由,就显著提高了多模态CoT性能。

  • SuperCLUE:领先的AI评测基准,衡量和比较AI模型性能。

    SuperCLUE是一个用于评估和比较大型语言模型性能的在线平台。它提供了多种任务和排行榜,旨在为AI研究者和开发者提供一个标准化的测试环境。SuperCLUE支持各种AI应用场景,包括数学推理、代码生成、超长文本处理等,能够帮助用户准确评估模型在不同任务上的表现和能力。

  • Berkeley Function-Calling Leaderboard:评估大型语言模型调用函数能力的排行榜

    Berkeley Function-Calling Leaderboard(伯克利函数调用排行榜)是一个专门用来评估大型语言模型(LLMs)准确调用函数(或工具)能力的在线平台。该排行榜基于真实世界数据,定期更新,提供了一个衡量和比较不同模型在特定编程任务上表现的基准。它对于开发者、研究人员以及对AI编程能力有兴趣的用户来说是一个宝贵的资源。

  • OpenAI & other LLM API Pricing Calculator:AI项目成本计算器,比较不同AI模型的成本。

    OpenAI和其他大型语言模型(LLM)API的成本计算器,帮助企业和开发者评估和比较不同AI模型在项目中的成本。该工具提供了包括OpenAI、Azure、Anthropic、Llama 3、Google Gemini、Mistral和Cohere等在内的多个模型的价格计算。它基于输入的token数、输出的token数和API调用次数来计算成本。

  • Clay Filter AI:将您的角色照片转换成粘土动画风格的图像

    粘土 AI 是一款 AI 工具,可以将照片转换成粘土动画风格的图像。通过分析面部特征,生成逼真的效果,提供灵活的编辑功能。价格定位为免费使用。使用比较简单,上传你的照片并提交,稍等10-20 秒可以获得粘土动画风格的图像。

  • TopMixLabs:在线AI视频动画生成工具

    TopMixLabs 是一个 AI 动画制作工具,通过上传图片,用户可以轻松地将图像转换为专业级动画,适用于各种规模的企业,提升品牌形象。使用简单,只需要4张照片,上传稍等10 -20分钟左右,即可以生成高质量的动画,生成的动画支持下载mp4格式,而且在平台上创建的动画用于个人和商业目的。

  • StartKit.AI:快速搭建AI创业项目

    StartKit.AI是一个旨在帮助开发者快速构建AI项目的在线平台。它提供了一个包含所有所需功能来发布SaaS产品的AI样板,无需AI经验即可使用。该平台由James和Danielle开发,他们拥有超过10年的SaaS产品开发经验,并成功运营着AI产品Ellie。StartKit.AI集成了30多个模块和超过8000行代码,提供了先进的AI特性,如聊天、图像、文本、语音、翻译和内容审核等。此外,它还包括了OpenAI的所有功能,并支持创建自己的ChatGPT克隆体。产品定位于帮助开发者快速启动AI项目,保持技术领先,并支持通过Stripe进行产品变现。

  • Cressi:AI驱动的个性化购物助手

    Cressi是一个由AI驱动的个性化购物助手,旨在通过分析用户的搜索历史、兴趣、联系人和日历等信息,提供定制化的购物建议。Cressi不仅能够理解用户的偏好,而且能够随着用户生活方式的变化而不断进化,提供真正人性化的购物体验。Cressi致力于使购物更加个性化、高客户满意度,并减少浪费,以实现更有意义和可持续的购物方式。

  • Decks:一款专业的笔记应用,助你快速掌握任何学科

    Decks是一款专为学习设计的应用,它通过创新的笔记方式帮助用户更快地掌握知识。用户可以免费开始使用,并在14天后选择月度或年度订阅。Decks提供每月8美元或每年79美元的订阅选项。

  • AutoPilotI18n:AI驱动的国际化工具 简化i18n流程。

    AutoPilotI18n 是一款利用 AI 技术提供精确翻译的国际化工具,可自动化翻译任务,简化 i18n 流程。其主要优点在于精确翻译、多框架支持、高效工作流程,适用于 React、Vue、Angular 等。AutoPilotI18n 定价透明,提供免费和付费版本。

今日大家都在搜的词: