- 京东零售的指标中台建设实践分享
本文将分享京东零售在指标中台建设方面的实践经验。京东指标中台依据现代数据栈、Headless BI、数据虚拟化和数据编织等方法论,并结合自身了多运营模式,多运营视角,多数据维度等业务特点,构建了从指标定义到指标生产再到指标消费的全链路解决方案。
陶然 · 2024-07-01 18:44 - 不只是前端,后端、产品和测试也需要了解的浏览器知识
本篇文章主要介绍一下作为研发了解浏览器的必要性, 以及浏览器的基本情况和整体的发展。在考虑产品定位时(开发出一款什么样的目标产品),我们需要对浏览器有一定的了解,整篇文章对研发和产品皆有一定的参考意义。
陶然 · 2024-07-01 18:30 - 金融行业在数仓建设与数据治理的实践
在当今信息爆炸的数字时代,数仓建设与数据治理显得尤为关键。本次分享将为您揭示如何构建一个强大的数据仓库,并进行有效的数据治理。从合理规划数据架构到实施,我们将探讨数据治理过程中的核心原则和优秀实践方案。
陶然 · 2024-06-28 17:08 - 爱奇艺Opal机器学习平台:特征中心建设实践
Opal 是爱奇艺大数据团队研发的一站式机器学习平台,旨在提升特征迭代、模型训练效率,帮助业务提高收益。整个平台覆盖了机器学习生命周期中特征生产、样本构建、模型探索、模型训练、模型部署等在内的多个关键环节。其中特征作为模型训练的基石,其重要性不言而喻,如何让用户借助平台的能力。
陶然 · 2024-06-28 13:11 - AIGC如何在大数据研发治理领域落地?
ChatGPT 掀起了大语言模型的热潮,AIGC与大数据研发治理能碰撞出什么火花?本文来源于大数据研发治理DataLeap基于AIGC的应用实践,将从数据研发和资产的角度介绍,如何运用AIGC能力提升效率,降低使用门槛。
陶然 · 2024-06-28 11:50 - 转转游戏MQ重构:思考与心得之旅
游戏业务自 2017 年启航,至今已近乎走过七个春秋,历经漫长岁月的发展,不知不觉间背负起沉重的历史包袱。犹如一棵大树,既有繁茂精壮的枝桠,亦有诸多枯败凋零的枝叶。此文主要聚焦于商品更新 MQ 消费这一细微模块,详述游戏业务如何对原有代码予以重构,令游戏这棵大树重焕蓬勃生机。
陶然 · 2024-06-27 16:12 - 多臂老虎机在推荐价策略中的应用
货运行业正处于迅猛发展的快车道上,其业务扩张之迅速与市场环境之多变令人瞩目。以货拉拉2023年的招股说明书为例,其年收入增长率达到了28.8%[6],凸显了持续加速的增长态势。另一方面由于市场价格波动大,用车需求非标,很难动态定准价格,议价是市场主流模式。
陶然 · 2024-06-27 14:50 - 吞吐量达4000+TPS!B站交易系统架构演进
会员购是B站2017年推出的IP消费体验服务平台,在售商品以手办、漫画、JK制服等贴合平台生态的商品为主。随着业务发展,会员购从最开始的预售、现货拓展到全款预售、盲盒、众筹等多种售卖方式,销售渠道也遍布QQ小程序、每年几次大促活动的爆发式流量,对于会员购交易系统来说,无疑是一个巨大的挑战。
陶然 · 2024-06-27 09:56 - 从缺陷到创新:质量保障的新视角
最近一段时间研发大佬们在积极的治理告警,经过一段时间的治理,现在告警情况已经有了很大的改观,但难免还有漏网之鱼;具体我们可以以下边一个例子来看:这是一个生产的UMP告警,通过这个告警我们发现XXX这个应用的堆内存使用率为90.18%,超过了设置的告警阈值85%,所以产生了这样的一个告警;那什么是堆内存呢?
陶然 · 2024-06-26 16:52 - 货拉拉大数据测试质效提升之路
随着货拉拉业务的高速发展,大数据在用户行为分析、广告定向投放、风险控制、用户画像、为公司管理层和运营团队提供决策帮助等方面,得到了越来越广泛的应用。大数据的源数据来源于业务数据、埋点数据等,每天有百亿级的数据交互,业务数据的复杂性和快速增长的数据量级,也对质量保障有了更高的要求。
陶然 · 2024-06-26 14:55 - 曙光存储再添新动力:分布式+集中式=双倍效能
近日,曙光存储以“先进存力 凝聚数据要素”为主题召开了存储新品发布会,展现了其在数据存储领域的最新成果。那么问题来了,曙光存储新品具备哪些创新特点?又是如何帮助企业更好地利用数据要素,推动数字化转型和智能化升级的呢?
陶然 · 2024-06-26 11:25 - 滴滴Elasticsearch全业务应用与实践
滴滴 ES 发展至今,承接了公司绝大部分端上文本检索、少部分日志场景和向量检索场景,包括地图 POI 检索、订单检索、客服、内搜及把脉日志 ELK 场景等。滴滴 ES 在2020年由2.X升级到7.6.0,近几年围绕保稳定、控成本、提效能和优生态这几个方向持续探索和改进,本文会围绕这几个方向展开介绍。
陶然 · 2024-06-26 09:59 - 强者恒存!曙光存储重磅新品再破存力上限
曙光存储召开了主题为“先进存力,凝聚数据要素”的新品暨品牌发布会,震撼发布全球首个亿级IOPS集中式全闪存储FlashNexus,重磅升级分布式存储ParaStor,同时推出行业首个通存解决方案,应对“强无止境”数据存储性能和成本需求。
陶然 · 2024-06-26 09:46 - 现身说法,AI小白的大模型学习路径
作为一个AI小白,把我自己学习大模型的学习路径还原出来,包括理解的逻辑、看到的比较好的学习材料,通过一篇文章给串起来,对大模型建立起一个相对体系化的认知,才能够在扑面而来的大模型时代,看出点门道。
陶然 · 2024-06-25 15:10 - 故障1min发现率100%,去哪儿秒级监控预警落地实践
伴随着大众井喷的出游住宿需求,去哪儿旅行酒店订单激增。watcher作为公司级的监控系统,承载着越来越重要的故障预警能力。但watcher当前给业务流量提供的数据精度都是分钟级的,以分钟级为精度的数据虽然也可以反映业务流量的情况,但对订单报警来说,其精度是有限的,带来的必然是分钟级的故障预警。
陶然 · 2024-06-25 09:44 - 大模型助力国际术语专业化,前后联动实现所见即所得
国际的系统不仅仅是语言多、词条多,而且基本涵盖了供应链体系的所有核心系统,在这些系统的词条翻译也缺少统一的国际专业术语,相同的业务释义在不同的业务条线就存在各种名字,内部沟通不仅费时费力,在客户使用京东系统时也会造成一些困惑。
陶然 · 2024-06-24 17:08 - 在电商场景中,如何建设全链路数据血缘?
随着业务的快速发展,数据不断膨胀。数据量增大,但数据产生的实际价值在哪里?数据血缘则可以帮助我们更好评估数据价值,并在满足业务需求的同时,控制存储计算资源的膨胀速度。与此同时,数据血缘还能够衡量数仓建设的优劣,并且做好数仓体系化建设。
陶然 · 2024-06-24 14:51 - 美团超大规模数据库容灾体系建设
容灾能力的建设目标是非常明确的,就是要能够应对和处理这种机房级和地域级的大规模故障,从而来保障业务的连续性。近几年,业界也发生了多次数据中心级别的故障,对相关公司的业务和品牌产生了非常大的负面影响。当前容灾能力已经成为众多IT企业建设信息化系统的必选项。
陶然 · 2024-06-24 09:44 - 视频云沉浸式音视频技术能力探索与建设
随着传输技术、显示技术与算力的持续提升,用户对于音视频体验的需求在提高,各家设备厂商也在探索和推出对应的技术与产品。打造空间感的空间视频与空间音频是其中最为关键的2项技术,bilibili视频云在这两项技术领域也进行了相关代探索与建设。
陶然 · 2024-06-21 14:19 - 干货|携程注册中心整体架构与设计取舍
目前,携程大部分业务已经完成了微服务改造,基本架构如图。每一个微服务的实例都需要和注册中心进行通讯:服务端实例向注册中心注册自己的服务地址,客户端实例通过向注册中心查询得知服务端地址,从而完成远程调用。
陶然 · 2024-06-21 09:31