数据科学工程实践


《数据科学工程实践》书籍摘要

《数据科学工程实践》是一本聚焦于数据科学在实际工程中应用的专业书籍。书中内容由来自腾讯、滴滴、快手等一线互联网企业的数据科学家、数据分析师和算法工程师的经验总结而成。

一、书籍目录

  1. 推荐序

  2. 前言

  3. 作者简介

  4. 第一部分 观测数据的数据分析技术

• 第1章 如何分析用户的选择

• 1.1 深入理解选择行为

• 1.2 DCM详述

• 1.3 DCM模型的Python实践

• 第2章 与时间相关的行为分析

• 2.1 生存分析与二手车定价案例

• 2.2 为什么不选择一般回归模型

• 2.3 生存分析在二手车定价中的应用

• 第3章 选择模型的贝叶斯推断

• 3.1 贝叶斯推断基础

• 3.2 贝叶斯推断在选择模型中的应用

• 3.3 选择模型的贝叶斯推断Python实践

• 第4章 使用离散选择方法进行用户行为分析

• 4.1 离散选择模型概述

• 4.2 多项Logit模型

• 4.3 嵌套Logit模型

• 第5章 基于用户行为的市场细分

• 5.1 市场细分的概念

• 5.2 基于用户行为的市场细分方法

• 5.3 市场细分的应用案例

• 第6章 对离散选择的计量进行估计

• 6.1 离散选择模型的估计方法

• 6.2 估计方法的比较

• 6.3 离散选择模型估计的Python实践

  1. 第二部分 实验设计和分析技术

• 第7章 A/B实验设计基础

• 7.1 A/B实验的原理

• 7.2 A/B实验的设计流程

• 7.3 A/B实验的应用场景

• 第8章 区组实验的设计和分析

• 8.1 区组实验的概念

• 8.2 区组实验的设计方法

• 8.3 区组实验的分析方法

• 第9章 特征筛选下的实验设计和分析

• 9.1 特征筛选的概念

• 9.2 特征筛选下的实验设计

• 9.3 特征筛选下的实验分析

  1. 第三部分 自助式数据科学平台SQLFlow

• 第10章 SQLFlow简介

• 10.1 SQLFlow的起源

• 10.2 SQLFlow的功能特点

• 10.3 SQLFlow的应用场景

• 第11章 SQLFlow的核心技术

• 11.1 SQLFlow的架构设计

• 11.2 SQLFlow的数据处理流程

• 11.3 SQLFlow的模型训练与评估

• 第12章 SQLFlow的实践案例

• 12.1 SQLFlow在电商行业的应用

• 12.2 SQLFlow在金融行业的应用

• 12.3 SQLFlow在其他行业的应用

二、核心内容

  1. 数据分析技术

• 书中第一部分重点介绍了观测数据的数据分析技术,包括用户选择行为分析、与时间相关的行为分析、选择模型的贝叶斯推断等内容。通过实际案例和Python实践,帮助读者掌握如何运用这些技术来分析用户行为和做出数据驱动的决策。

  1. 实验设计与分析

• 第二部分围绕实验设计和分析技术展开,涵盖了A/B实验设计、区组实验设计和特征筛选下的实验设计等内容。这些内容对于企业在产品优化、功能测试等方面有着重要的指导意义,能够帮助企业科学地设计和分析实验,以获取可靠的结果。

  1. 自助式数据科学平台

• 第三部分详细介绍了自助式数据科学平台SQLFlow。包括其起源、功能特点、架构设计、数据处理流程以及在电商、金融等行业的实践应用。SQLFlow为数据科学家和分析师提供了一个便捷的平台,能够提高数据处理和模型训练的效率。

三、总结

《数据科学工程实践》是一本内容丰富且具有实践指导意义的书籍。它将数据科学的理论与实际工程应用紧密结合,通过大量的案例和实践操作,帮助读者深入理解数据科学在商业环境中的应用方法和技术,适合数据科学领域的从业者和相关专业的学生阅读。