首页 > 动态 > 关键词  > 滴滴最新资讯  > 正文

这场让硅谷工程师一票难求的技术分享会,滴滴都讲了啥?

2017-11-22 14:55 · 稿源:站长之家

11 月 19 日,滴滴在美研新办公室举办了一场针对当地科研人员的技术沙龙。滴滴科技线的管理者们集体出席,并跟当成的硅谷工程师们分享了滴滴怎么构思未来的技术变革。作为全球单量最高的移动出行公司,这样一支技术“梦之队”,驾驭全世界最庞大的交通数据,从算法、产品到安全策略,服务着全球最大的出行市场。最终这场沙龙进行了长达 3 个多小时的交流,吸引了数百位硅谷工程师的参加。

CTO愿景:人 车 路 未来交通的“三重革命”

滴滴CTO张博说,五年前滴滴在北京创立时,面前摆着一个几乎不可能解决的供需难题:为 2 千多万北京居民,匹配 67000 辆出租车。为了缓解供需矛盾,滴滴选择吸纳更多私家车的闲置运力,推动拼车,和多样化的出行方式,让城市交通运行更有效率 。

如今滴滴平台上的出行服务超过 11 个,日峰值订单超过 2500 万,同时产生了大量交通数据。这些数据帮助“滴滴大脑”不断进化,优化分单模型、提高供需预测的精准度,最终反映在用户对产品的满意度上。与滴滴大脑一同进化的还有产品背后的技术团队。目前公司的科学家和工程师队伍已超过 3 千人。

滴滴CTO张博介绍公司发展历程和愿景

在张博率领的技术团队眼中,解决供需矛盾依然是改善出行的关键,但今时今日他们的破题思路已经有了更多角度。未来的交通变革会体现在三个层面:最下面的一层是交通基础设施,包括智能红绿灯、动态道路分配、更科学的路网设计等,目标是最大化道路使用效率;中间一层是车辆交通工具本身的变革,智能化、新能源化将是趋势;最上面一层则是共享出行,越来越多的人会放弃拥有车辆,而是共享车辆,并且共享的颗粒度会从车的维度降维到座位,这样整个社会需要的车辆数量会显著下降,这是解决拥堵最快、最有效的方法。

目前滴滴的技术团队也希望从这三个层面全面推动未来交通变革。在公司成立的第五年,滴滴来到硅谷设立研究机构,希望更多全球人才加入这支队伍,一起解决这个世界级的挑战。

在张博开场之后,技术线的管理者依次用英语分享了对各个领域的思考,滴滴CTO线的实力全景呈现。

创新超越国界 产品经理的语言是世界的语言

滴滴产品高级副总裁俞军和他曾震动业界的“PM12 条”首先引起了极大的兴趣。 “还在国内读书的时候,就听过俞军的‘ 12 条军规’。可是在美国工作了这么些年之后能听他用英文来分析,听他说,用户需求要去discover而不是manufacture,才意识到原来产品经理的语言是通行世界的语言,很多中国市场的经验真的和硅谷这些年对产品的思考也紧密契合。”一位来自Facebook的工程师感慨地说。

滴滴产品高级副总裁俞军给硅谷工程师讲PM12 条

AI的“滴滴崛起”:强悍的“大脑”和温暖的“心”

学习,预测,判断的能力,是人工智能的核心。滴滴研究院副院长叶杰平对人工智能技术在应用场景中发挥的关键作用如数家珍:从目的地预测、智能派单、路径规划, 到供需预测、拼车、服务评价,让现场的极客们表示 “相当过瘾”。

更引起大家好奇的是叶教授描述的在滴滴工作的场景:来自五湖四海的数据科学家和工程师不仅在构思未来“完美交通”的科幻场景,更从当下开始,通过每一个算法的演化,让司机收入一天天提高,乘客体验一天天改善,“这也是我们改变世界的方式”。

滴滴研究院副院长叶杰平详解“滴滴大脑”

智慧的交通 “云上”的城市

从数据大脑的神奇结构,滴滴高级副总裁章文嵩的“滴禹”平台,将听众的注意力从精微的算法,引向城市的“云端”:滴滴希望和城市管理者合作,用人工智能的分析预测和全局调配能力,全局把握城市交通问题。从济南到武汉,深圳到天津,章文嵩的团队正在中国大江南北展开多种多样的智慧交通实验,还引起了南美、中东和东南亚不少城市政府的关注。

滴滴高级副总裁章文嵩解读智慧交通

“这是一个技术人梦寐以求的那种挑战。”密西根大学终身教授刘向宏用自身经历现身说法。今年初他加盟智慧交通团队,从湾区把行李丢在滴滴软件园办公室,便一头扎进一些最拥堵的中国城市中去啃“硬骨头”:找到最拥堵的路口优化信号灯的切换时间。刘向宏提到,智慧城市的建设是中国工程师们另一个弯道超车的好机会:目前美国有很多信号灯没有传感器,还在采用固定配时。如果未来每一个路口的信号都能运用移动互联网数据,优化调整信号灯配时,这为解决城市道路拥堵提供新的思路。

滴滴智慧交通首席科学家刘向宏描述未来城市交通体系

魔高一尺 道高一丈 安全是共享的另一面

当万物互联,人工智能没有边界,怎样保证系统的强韧,不受外界威胁?作为滴滴体系的“守门人”,滴滴信息安全战略副总裁弓峰敏分享了他对车联网时代信息安全的思考。智能驾驶系统对信息安全有了更高的要求,滴滴不仅汇聚了业界顶尖的人才,更在复杂的中国信用与风险环境中锻炼出了强韧的抵抗力,正在建设主动防御的云安全体系。

而作为线上线下服务的融合者,滴滴面对的不仅是线上的信息安全,更有亿万乘客的生命信托。信息安全副总裁卜峥在现场分享了目前滴滴的五大核心安全措施,以及团队如果运用大数据手段为用户的安全保驾护航。卜峥透露滴滴正在探索利用声纹识别等更多新技术手段,保证出行安全。

滴滴信息安全战略副总裁、美研负责人弓峰敏解读车联网信息安全难题

滴滴信息安全副总裁卜峥分享共享出行平台的安全技术体系

滴滴智能驾驶技术负责人贾兆寅(右一),数据科学部负责人宋世军(右二),信息安全副总裁卜峥(右三)普林斯顿大学教授 Alain Kornhauser(右四)讨论智慧交通的挑战

主题演讲之后,包括普林斯顿大学教授在内的多位专家和滴滴技术人一起共同探讨未来城市交通的突破。滴滴的“梦之队”笑言,会后收获的最多的两个问题是:“下一次什么时候再分享?”以及“滴滴在招人吗?”对于滴滴来说,这次近乎爆棚的技术分享活动只是扩大海外影响力,加速组建国际化科研团队的开始。

举报

  • 相关推荐
  • 大家在看
  • SpeedLegal:个人AI合同谈判助手

    SpeedLegal是一个利用机器学习技术(特别是深度学习、大型语言模型和通用AI)来突出合同中的条款和关键风险的技术初创公司。我们分析您的文档并发送给您一个简化的报告,以便您在签名前做出更明智的决策。

  • FCK.School:AI写作工具

    FCK.School是一个为学生提供AI写作工具的在线平台。它可以帮助学生改善写作技巧,提升学术表现。通过FCK.School的AI驱动工具,学生可以进行文本改写、文摘、语法纠错等操作,还能生成各种写作素材,如标题、论点、大纲等。FCK.School提供免费工具以供试用,同时还有付费订阅计划。

  • CompliantChatGPT:AI医疗助手,HIPAA合规

    CompliantChatGPT是一款专为医疗保健行业设计的AI助手,它通过HIPAA合规的方式,帮助医疗工作者安全、高效地处理医疗相关任务。产品具备以下特点: - 保护患者数据安全,通过令牌化技术确保个人健康信息(PHI)的安全。 - 提供个性化的医疗模式,包括血液分析、PHI匿名化、诊断和治疗规划等。 - 用户友好的界面设计,支持语音到文本的笔记功能,便于记录和回顾。 - 定价策略灵活,提供免费试用,以及多种付费套餐选择。 - 适用于医疗提供者、专业人士、医疗机构、研究中心和健康科技初创企业。

  • Healax:AI驱动的心理健康解决方案

    Healax是一款创新的AI驱动的心理健康解决方案,专为学生设计,帮助他们主动应对日常生活中的压力和焦虑。该产品通过建立学生、行政人员和提供者之间的信任沟通渠道,提供定制化活动和内容,以促进更全面的教育体验。

  • Snowflake Arctic Embed:开源的先进文本嵌入模型

    Snowflake Arctic Embed是一系列基于Apache 2.0许可开源的文本嵌入模型,专为检索用例设计。这些模型在Massive Text Embedding Benchmark (MTEB)检索基准测试中提供了领先的检索性能,为组织在结合专有数据集与大型语言模型(LLMs)进行检索增强生成(RAG)或语义搜索服务时提供了新的优势。这些模型的尺寸从超小型(xs)到大型(l),具有不同的上下文窗口和参数数量,以满足不同企业的延迟、成本和检索性能需求。

  • DuerOS X:全球首个AI原生操作系统

    DuerOS X是小度基于百度文心大模型推出的全球首个AI原生操作系统。它彻底颠覆了传统的人适应系统的模式,实现了端到端连接用户的意图与任务,极大地拓展了操作系统的边界。DuerOS X全面应用了文心大模型,通过模型路由架构,能够灵活调度不同的文心模型去解决不同难度的问题,更高效、更精准、更经济。个性化长短记忆的存储、提取和理解能力,使得DuerOS X能够更清楚地记住历史内容与用户个性化偏好。此外,多模态感知技术的应用,让DuerOS X产生更丰富的感知力,无论是通过语音、文字还是表情与小度沟通,都能准确地理解用户的意图,并给出恰当的回应。

  • abab 6.5:万亿参数MoE文本大模型

    abab 6.5系列包含两个模型:abab 6.5和abab 6.5s,均支持200k tokens的上下文长度。abab 6.5包含万亿参数,而abab 6.5s则更高效,能在1秒内处理近3万字的文本。它们在知识、推理、数学、编程、指令遵从等核心能力测试中表现出色,接近行业领先水平。

  • mistral-common:Mistral模型工具集

    mistral-common是一套帮助您处理Mistral模型的工具。它不仅包含文本到token的转换,还增加了工具解析和结构化对话。目前发布了三个版本的tokenizer,分别适用于不同的模型集合。

  • AI Grammar Checker & Paraphraser – LanguageTool:提供语法检查和改写的工具

    AI语法检查与改写工具- LanguageTool是一款免费的语法检查工具,可以检测文本中的语法错误并提供改写建议。它能够检测出拼写错误、语法问题、常见词汇混淆和标点符号错误,并提供改写建议、同义词替换和简洁句子重写。该工具适用于多种语言,支持多个平台和应用场景,如社交媒体、电子邮件和网页。

  • Spline AI 3D Generation:快速生成三维模型的AI工具

    AI 3D Generation是Spline推出的一款3D设计工具,它支持文本到3D生成和图像到3D生成,允许用户通过简单的文本提示或2D图像自动创建出详细且精确的3D模型。该工具具有生成变体与混合、直观且适合初学者、创建独特的3D库、平台集成与实时协作、易于集成和发布等功能。

  • FocuSee:轻松录屏 软件会自动跟踪光标移动美化录屏效果

    FocuSee 自动跟踪光标移动,应用动态缩放效果,为您节省宝贵时间和额外的努力。适用于演示,教程,推广视频等多种场景。

  • Ai-to-pptx:使用AI技术来自动生成PPTX 支持在线修改

    Ai-to-pptx 是一个使用 AI 技术 (ChatGpt 和 Gemini) 制作 PPTX 的助手,支持在线修改和导出 PPTX。主要功能包括使用 ChatGPT 等大语言模型生成大纲、允许用户再次修改内容、选择不同模板、在线修改 PPTX 的文字、样式、图片等,支持导出 PPTX、PDF、PNG 等多种格式。价格为付费,商业授权价格为 22000 元人民币或 3000 美元。

  • CodeQwen1.5:开源代码助手,高效编程新选择

    CodeQwen1.5是一个基于Qwen语言模型的代码专家模型,拥有7B参数,支持92种编程语言,最长支持64K的上下文输入。它具备代码生成、长序列建模、代码修改和SQL能力等,旨在提高开发人员的工作效率,简化软件开发流程。

  • PixArt-Sigma:4K文本到图像生成的扩散变换器

    PixArt-Sigma是一个基于PyTorch的模型定义、预训练权重和推理/采样代码的集合,用于探索4K文本到图像生成的弱到强训练扩散变换器。它支持从低分辨率到高分辨率的图像生成,提供了多种功能和优势,如快速体验、用户友好的代码库和多种模型选择。

  • InstantMesh:高效3D网格生成框架

    InstantMesh是一个基于LRM架构的前馈框架,用于从单张图像高效生成3D网格。它支持低内存GPU环境,并能生成具有纹理映射的3D网格模型。

  • MagicClothing:基于LDM的服装驱动图像合成AI

    MagicClothing是一种基于潜在扩散模型(LDM)的新型网络架构,专门用于服装驱动的图像合成任务。它能够根据文本提示生成穿着特定服装的定制化角色图像,同时确保服装细节的保留和对文本提示的忠实呈现。该系统通过服装特征提取器和自注意力融合技术,实现了高度的图像可控性,并且可以与ControlNet和IP-Adapter等其他技术结合使用,以提升角色的多样性和可控性。此外,还开发了匹配点LPIPS(MP-LPIPS)评估指标,用于评价生成图像与原始服装的一致性。

  • FireCrawl:无需站点地图,一键抓取网站所有子页面

    FireCrawl 是一款由 Mendable.ai 开发的开源项目,它能够无需站点地图即可抓取任何网站的所有可访问子页面,并将这些内容转换为干净、格式化的Markdown文档。它特别适合数据科学家、机器学习工程师、内容创作者和市场分析师使用,以从网站内容中提取有价值的信息。FireCrawl 能够处理使用JavaScript动态渲染的内容,提供API服务,支持自托管,并与多种开发者工具和框架集成。

  • Atlas:下一代电动机器人

    Atlas是波士顿动力公司开发的一款先进的人形机器人,它结合了数十年的研究和实际经验,旨在解决当今工业领域中最艰巨的挑战。新一代的Atlas机器人是全电动的,比以往的液压版本更强大,动作范围更广,能够更高效地完成各种任务。Atlas机器人配备了新的AI和机器学习工具,如强化学习和计算机视觉,以确保它们能够适应复杂的现实世界情况。此外,Atlas将与波士顿动力公司的Orbit™软件集成,该软件提供了一个集中的平台来管理整个机器人车队、站点地图和数字化转型数据。

  • Stable Diffusion 3 API:先进的文本到图像生成系统

    Stable Diffusion 3是一款先进的文本到图像生成系统,它在排版和提示遵循方面与DALL-E 3和Midjourney v6等顶尖系统相匹敌或更优。该系统采用新的多模态扩散变换器(MMDiT)架构,使用不同的权重集来改善图像和语言的表示,从而提高文本理解和拼写能力。Stable Diffusion 3 API现已在Stability AI开发者平台上线,与Fireworks AI合作提供快速可靠的API服务,并承诺在不久的将来通过Stability AI会员资格开放模型权重以供自托管。

  • 奇布塔:AI一站式儿童有声绘本创作平台

    奇布塔是基于人工智能生成技术的绘本创作平台,提供各种风格的有声绘本创作功能,帮助用户创作优质的绘本内容。定价灵活多样,定位于绘本创作者和儿童阅读者市场。

今日大家都在搜的词: