IT168首页 > 陶然
  • APMPlus 尾采样技术的降本增效实践

    在现代软件工程架构实践中,工程师普遍面临一个挑战:如何在海量的请求中精确捕捉异常链路,同时避免数据成本的快速增长。本文将探讨分布式链路追踪(Distributed Tracing)中的采样(Sampling)技术,并介绍火山引擎 APMPlus 团队在尾采样(Tail-based Sampling)方面的技术实践,以期为解决上述挑战提供一种思路。

    陶然 · 2026-01-22 16:40
  • vivo互联网全链路多版本环境落地实践

    在软件研发过程中,“环境问题”是制约研发效能的关键瓶颈之一。环境不稳定、测试环境混乱、环境抢占严重等问题,显著影响开发与测试效率。本文系统介绍vivo通过“全链路多版本环境管理”模式,实现开发测试环境的快速构建与高效管理,使多版本环境能够像“平行宇宙”一般,实现安全、隔离、高效的并行测试与发布。

    陶然 · 2026-01-22 10:00
  • 面向未来的长期主义:在不确定的时代,构建确定性的存储底座

    我们正在经历一个技术变化速度前所未有的时代。从大模型、智能制造到自动驾驶、视频生成,AI正以前所未有的速度重塑各行各业。但如果把视角拉得更长远,我们会发现一个更底层、也更确定的趋势正在同步发生:数据规模的持续膨胀,是不可逆的长期变量。随之而来的,还有个人和组织对于数据价值观的变化。

    陶然 · 2026-01-21 09:54
  • 以前那套故障管理方法可能不行了

    在“SRE转型”系列的第一期推文《SRE转型 | 稳定性保障系列之运维左移》中,我们围绕系统稳定性保障工作,分享了针对软件上线前期的运维左移工作的工作思路与实施策略。接下来,本文将深入探讨广发证券在事中应急处理和事后复盘方面应急指挥场景的实践,从而提升业务连续性和稳定性。

    陶然 · 2026-01-20 09:19
  • 解耦、中立、常青:XSKY AIMesh击穿阻碍AI效率的“三堵墙”

    传统存储架构在AI负载下已经暴露出严重的性能瓶颈,在大量训练与数据工程场景中,GPU利用率被I/O等待拉低至30-50%,数据孤岛问题在混合云环境下愈加突出,长上下文推理场景中内存成本呈指数级增长。针对上述挑战,2026年1月15日,XSKY在北京举办了主题为“数据常青 智算无界”的AIMesh产品战略发布会,宣布战略重心从“信息技术(IT)”全面跨越至“数据智能(Data Intelligence)”。

    陶然 · 2026-01-15 17:51
  • 百度流式计算开发平台的降本增效之路

    对实时数据处理需求的增长,传统流式计算方式在开发复杂度、运维成本和系统扩展性上面临诸多挑战。文章结合实际业务背景,详细分析了这些痛点,并提出通过k8s容器编排与云原生技术构建流式计算PaaS平台的解决思路。该平台将底层资源、自愈、状态管理等复杂性封装为自动化和配置化服务,有效降低团队使用门槛,提升运维效率和资源利用率。

    陶然 · 2026-01-15 09:28
  • Instagram十亿级“用户名已被占用”背后的架构设计

    当你在Instagram等平台上注册并输入用户名时,系统会立即告诉你该用户名是否可用。如果已被占用,它会立即提供其他替代用户名。每次用户注册时,他们根本不可能逐条扫描数十亿条记录。那么,他们是如何在眨眼间完成这一切的呢?本文将逐步介绍这些系统的构建过程,从最基本的方法开始,逐步升级到大型科技公司采用的复杂架构。

    陶然 · 2026-01-13 17:14
  • 滴滴前端工程师的研发效率提升笔记

    工具的价值最终取决于使用它的人。要充分释放AI-IDE的潜力,核心在于我们开发者如何去引导、利用并与AI高效协作。本文旨在将主要前端开发的视角展开,结合具体的开发场景,分享一些在日常工作中有效利用AI-IDE,以显著提升工作效率与代码质量的实践经验。

    陶然 · 2026-01-13 10:15
  • 从Kafka到AutoMQ:爱奇艺实时流数据架构演进

    本文详细介绍了爱奇艺在处理大规模实时流数据时,从传统Kafka架构向AutoMQ演进的技术历程。为了解决私有云环境下集群扩缩容难、资源利用率低以及运维成本高等挑战,爱奇艺开发了Stream平台与Stream-SDK,实现了业务与底层存储的彻底解耦。

    陶然 · 2026-01-09 14:23
  • B站社群AI智能分析系统的实践

    在B站,我们运营团队需要管理着数量庞大的UP主交流群,如:品类扶持、成长训练营、专项交流、答疑沟通群等。覆盖许许多多的创作者,每天会产生大量的消息。如果完全依赖人工逐条统计,不仅效率低下,而且容易遗漏关键问题。早期运营尝试过简单的关键字分析和人工汇总的方式,但这种传统方案存在明显局限:

    陶然 · 2026-01-07 14:01
  • 前端平台大仓应用稳定性治理之路|得物技术

    随着公司业务的快速发展,前端平台作为研发职能部门,在高效支撑业务迭代的同时,前端新建的应用不断增加,截止到2023年5月在Uraya平台统计的各业务域的应用(B端+C端)总数已经达到170多个,发布流程中出现问题的风险逐步显现,稳定性问题逐步突出。

    陶然 · 2026-01-06 09:35
  • Apache Hudi 在京东的最新架构演进

    本文基于京东&HudiMeetup亚洲站的分享内容,详细介绍京东数据湖现状、最新自研技术特性、业务实践、社区贡献与未来规划,展示京东如何通过数据湖技术推动数据资产准实时化,提升数据资产的价值。

    陶然 · 2025-12-31 15:34
  • 一文解码百度地图LD-VLG端到端地图生成大模型

    百度地图 LD-VLG 端到端多模态地图生成大模型,通过自动理解道路、识别变化并生成最新车道级地图,成为真正意义上的“地图大脑”。百度地图 LD-VLG 是如何做到让地图实时“保持新鲜”的?本文带你一探究竟!

    陶然 · 2025-12-31 14:08
  • 孟晚舟发布华为新年致辞:战略聚焦,以质取胜

    时光的潮水正漫过2025的岸线,回望这一年的忙碌与奔赴,那些深浅不一的足迹,正是我们奋力向前的最好见证:在撒哈拉沙漠南缘,网优工程师穿梭在44℃高温、红土飞扬的街头,厘清网络症结;在大西洋的七级风浪中,光网专家克服严重晕船,和客户一起定位故障、恢复通信。

    陶然 · 2025-12-30 11:33
  • openGauss Summit 2025在京召开,加速行业智能化变革,共建繁荣数据库生态

    2025年12月26日,由openGauss社区主办的年度旗舰盛会——openGauss Summit 2025在北京成功举办。大会汇聚了数据库领域的顶尖学者、技术专家、行业用户及生态伙伴,共同探讨了开源数据库的技术前沿、生态协同与行业实践,展现了openGauss作为企业级开源数据库根社区的活力与引领力。

    陶然 · 2025-12-26 23:23
  • 昇思MindSpore引领AI框架迈入“超节点时代”

    今日,昇思人工智能框架峰会在杭州国际博览中心召开,本次大会以“昇思MindSpore为超节点而生的AI框架 ”为主题。会上,昇思MindSpore聚焦超节点技术创新,打造昇思HyperParallel架构,加速新模型结构和新训推范式创新,引领AI框架迈入“超节点时代”。

    陶然 · 2025-12-25 19:22
  • 当万卡集群“瘦身”挤进一个展台,中国AI算力正在拆掉“围墙”

    近日,首届光合组织人工智能创新大会(HAIC2025)以“智算无界,光合共生”为主题,汇聚了全产业链超2500家企业代表。这不仅仅是一场年度盛会,更是一次在中国AI步入“人工智能+”关键阶段,对开放路线的集体宣言与成果检验。

    陶然 · 2025-12-25 10:13
  • 百度一站式全业务智能结算中台实践

    本文深入介绍了百度一站式全业务智能结算中台,其作为公司财务体系核心,支撑多业务线精准分润与资金流转。中台采用通用化、标准化设计,支持广告、补贴、订单等多种结算模式,实现周结与月结灵活管理。通过业务流程标准化、分润模型通用化及账单测算自动化,大幅提升结算效率与准确性,确保数据合规与业务稳健发展。

    陶然 · 2025-12-23 10:52
  • “数智龙江”进行时:看黑龙江的“算电融合”突围之路

    近日,以“数智龙江 算电即达”为主题的华为中国行2025 · 黑龙江算电融合与人工智能创新发展峰会隆重举行。这不仅是一次行业前沿技术的集中展示,更像是一份来自黑龙江的宣言:在新质生产力崛起的时代,这片沃土正试图将自身丰厚的资源禀赋、扎实的工业基底与优秀的数智技术深度融合,探索出一条具有龙江特色的高质量发展新路径。

    陶然 · 2025-12-23 09:11
  • 从社区繁荣到行业实践,尽在openGauss Summit 2025

    在此背景下,openGauss Summit 2025 大会应运而生,将于2025年12月26日在北京召开。本届大会不仅是技术发布的舞台,更将是一场全景式展现开源数据库生态建设成果与行业数字化转型实践的盛会。

    陶然 · 2025-12-19 17:13