- 告别中心云:构建分布式联邦AI的三大技术支柱
传统云计算依赖集中式数据训练模型,但边缘计算的普及催生了新范式——去中心化机器学习。其核心代表——联邦学习正在颠覆传统流程。本文将对联邦学习概念及其三个关键技术展开讨论。
陶然 · 2025-06-25 17:35 - 谷歌推出的AI Overview和AI Mode对内容创作者来说意味着什么?
谷歌推出了AI Overview和AI Mode这两项新功能,通过人工智能生成摘要和对话式聊天机器人响应用户查询,以减少用户点击其他网站的需求,而这对于依赖谷歌自然流量的网站构成生存威胁。内容创作者需要调整策略应对AI Overview和AI Mode带来的冲击,例如优化人工智能概览内容、建立直接流量等。
陶然 · 2025-06-24 15:59 - 百度日志中台前端重构实践
日志中台是百度内部针对打点数据的全生命周期管理平台,作为公司日志数据的唯一入口,承担以下核心职能:1.功能覆盖:提供从数据采集、传输、存储到查询分析的一站式服务,支持产品运营分析、研发性能监控、运维管理等多元场景。
陶然 · 2025-06-24 10:08 - 浅谈阿里云服务领域Agent构建的方法论
本文我想要探讨的一个主要话题就是“如何构建真正能在业务上落地的、可用性高的Agent”。当然,这个问题也是一个比较复杂、庞大的话题,我无法在文中给出通用的解决方案,仅仅是从阿里云服务领域的Agent构建视角出发,来讨论一下我们在Agent开发和调优的过程中走过的路、踩过的坑。
陶然 · 2025-06-23 09:27 - 一致性框架:供应链分布式事务问题解决方案
在当今微服务架构盛行的时代,分布式系统已经成为企业级应用的标准模式。然而,随之而来的分布式事务问题也成为了开发人员的一大挑战。在复杂的供应链系统中,各个业务模块之间的数据一致性一直是一个重要且棘手的问题。物流、库存、订单等系统相互协作,如何在保证业务高效运转的同时,确保跨系统操作的数据一致性?
陶然 · 2025-06-20 14:27 - GPMI产业发展再提速——GPMI产业生态推进会暨电视操作复杂治理标准研讨会召开
为贯彻落实《关于加快推进视听电子产业高质量发展的指导意见》精神,推动高速数字接口GPMI技术的产业化应用,以及通过标准化手段进一步治理电视操作复杂问题,由中国电子技术标准化研究院等单位联合主办的“GPMI产业生态推进会暨电视操作复杂治理标准研讨会”于2025年6月19日在北京万寿宾馆召开。
陶然 · 2025-06-19 16:31 - 揭开德国百万兆级“JUPITER”超级计算机的面纱
在6月份的Top500排名中,最新的百万兆次级超级计算机是期待已久的位于德国Forschungszentrum Jülich工厂的“Jupiter”系统。我们终于对这台混合CPU-GPU机器的性能有了一定的了解,尽管其配置的一些细节仍未公开确定。
陶然 · 2025-06-19 15:55 - 百度垂搜数据管理系统弹性调度优化实践
百度垂直搜索系统将搜索核心能力赋能阿拉丁(百度搜索特型结果)、垂直领域搜索、应用内搜索等场景,支撑了数百个检索场景、百亿级内容数据的检索。随着接入业务数量和数据量不断增长,系统在海量数据管理与调度上遭遇新的挑战,通过垂搜数据管理系统弹性调度优化实践来满足业务增长需求。
陶然 · 2025-06-19 14:08 - 从Wi-Fi 8到UWB雷达,看Qorvo如何重构无线连接与智能生态?
在万物互联的时代,无线连接与高效电源管理技术正成为推动数字化转型的核心动力。近日,Qorvo媒体日活动顺利举行,技术专家围绕Wi-Fi 8前沿进展、UWB精准定位与Matter生态、集成PLP的电源管理方案展开深度分享,揭示了未来智能生活、工业互联与数据中心的技术演进脉络。
陶然 · 2025-06-17 17:30 - 谷歌云全球崩盘!OpenAI、Shopify瘫痪,万亿级服务为何一夜失灵?
6月13日凌晨,谷歌云突发全球性服务中断,持续时间超过3小时,导致OpenAI的ChatGPT、电商巨头Shopify、支付服务Square等依赖其基础设施的众多平台陷入瘫痪。
陶然 · 2025-06-16 08:33 - openFuyao开源:解锁“云原生+AI”时代的算力编排密码
作为多样化算力集群软件开源社区,openFuyao是继openEuler开源操作系统、openGauss开源数据库之后,面向业界开源的又一力作。其诞生标志着中国在算力集群软件生态领域的战略布局再落关键一子,打造全球领先的多样化算力集群软件根生态。
陶然 · 2025-06-13 16:00 - BaikalDB架构演进实录:打造融合向量化与MPP的HTAP查询引擎
BaikalDB作为服务百度商业产品的分布式存储系统,支撑了整个广告库海量物料的存储和OLTP事务处理。随着数据不断增长,离线计算时效性和资源需求压力突显,基于同一份数据进行OLAP处理也更为经济便捷,BaikalDB如何在OLTP系统内实现适合大数据分析场景的查询引擎以应对挑战?
陶然 · 2025-06-12 09:41 - 1160亿“蛇吞象”背后:海光并购曙光的野心与隐忧
日前,中国半导体行业迎来一场地震级交易——国产CPU龙头企业海光信息宣布以1160亿元换股吸收合并服务器巨头中科曙光。这场“蛇吞象”式的并购,不仅创造了2025年国内科技领域大规模的整合案,更标志着国产算力产业链从“单兵作战”迈向“集团军”时代的转折。然而,这场豪赌背后,是国产替代的雄心,还是资本游戏的泡沫?
陶然 · 2025-06-11 16:27 - 以代码丈量时代,用长跑定义创新,一位可观测性领航者的17年征程
本期《名人堂——“数”风流人物》栏目对话陈靖华,探寻他的成长经历、创业历程、团队建设,解读这位科技人物的奋斗故事与远见洞察。
陶然 · 2025-06-10 18:09 - 七种方式让你的AI编码结果更靠谱
企业在积极引入AI的同时,也希望雇用更多工程师,期望开发者能够借AI之力将产出“提升10倍”。但要真正高效运用AI编码助手,其中也有不少门道。首先是AI编码助手的固有局限,其存在大量不确定性,因此容易引发种种难以避免的意外行为,例如随机删除代码或引入逻辑错误。
陶然 · 2025-06-10 14:31 - 货拉拉基于LWS实现的大模型分布式实践
海豚平台是货拉拉自研的一站式云原生AI开发平台,覆盖了从数据处理、镜像构建到模型开发、训练、部署及在线推理的全流程。经过近两年的建设,海豚平台已成为货拉拉AI开发的核心基础平台,显著提升了AI开发人效和算力资源利用率,有力推动了公司AI技术与业务的发展。然而随着大模型技术的快速发展,海豚平台在部署大模型时迎来新的挑战。
陶然 · 2025-06-06 15:59 - 如何为数百万用户构建可扩展性系统?
你可能知晓,在大型科技公司计划为数百万用户提供服务时,系统的可扩展性能力通常需要从一开始就成为设计的一部分,而不应在后期被追加。否则,随着用户期望的不断攀升和全球流量模式的变化,该系统将根本无法应对。下
陶然 · 2025-06-06 15:51 - 为什么大语言模型在对话中会“迷失”?
微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。
陶然 · 2025-06-04 16:58 - B站服务器故障管理实践与探索
随着B站业务的快速发展,用户规模和内容生态不断扩展,平台的技术架构也在不断演进。伴随着这一增长,服务器数量呈现出爆发式增长,支撑起了海量用户请求和复杂的业务场景。然而,随着机器规模的持续扩大,服务器故障管理面临的挑战也愈发严峻。
陶然 · 2025-06-03 14:18 - 智能体网格:未来的企业智能体新生态
如今,新的AI智能体平台不断涌现,每个平台都承诺将彻底改变工作方式。号称只需将一项任务交给 AI智能体,它就能自主规划、执行并交付完美结果。行业领袖正积极推动这一愿景。英伟达CEO黄仁勋预测,我们很快将在企业内部看到“数亿个数字智能体”。微软首席执行官 Satya Nadella 的观点更进一步:“智能体将取代所有软件。”
陶然 · 2025-05-27 15:53