数据分析实战-Books


《数据分析实战》读书摘要

《数据分析实战》是一本实用的数据科学书籍,它为读者提供了系统的数据处理、分析和建模方法,并通过大量的Python代码示例展示了如何将这些方法应用于实际问题中。

一、核心内容

这本书围绕数据分析的整个流程展开,从数据准备开始,逐步深入到数据探索、数据处理和建模等环节。

  1. 数据准备

• 书中详细介绍了如何使用Python读取和写入常见的数据格式,如CSV、TSV、JSON、Excel和XML等。例如,通过Python的pandas库可以方便地读取CSV文件,为后续的数据分析打下基础。

• 还包括如何从网页上抓取数据,例如使用BeautifulSoup库来解析HTM...

Read more

谷歌数据分析方法-Books


《谷歌数据分析方法》书籍摘要

《谷歌数据分析方法》是一本专注于数据分析领域的专业书籍,旨在为读者提供一套以用户为中心的数据分析思维框架。

一、书籍目录

  1. 推荐序

  2. 前言

  3. 作者简介

  4. 第1章 数据分析进阶的全新世界

• 1.1 数据分析现状

• 1.2 行业现状

• 1.3 重新反思数据分析:实现数据分析进阶

• 1.3.1 “是什么”:点击流

• 1.3.2 “有多少”:多样性产出分析

• 1.3.3 “为什么”:用户实验和测试

• 1.3.4 “如何做”:用户反馈

• 1.3.5 “还有什么”:竞争情报分析

• 1.4 变革:Yes We Can

• 1.4.1 策略性调...

Read more

数据可视化入门与实战


这些图片展示了一本名为《数据可视化入门与实战》的书。该书由张超、董慧、张平亮著,由化学工业出版社出版。

书中主要内容包括:

• 数据可视化概述,介绍了数据可视化的发展背景、特点及意义,以及在医学、天文、商业、工业、地理、金融、网络监控、文化与艺术等领域的应用。

• 大数据分析与数据可视化,涵盖大数据的概念、数据可视化与其他学科的关系、数据可视化的应用等。

• 数据可视化技术,包括可视化的分类、基于数据类型的分类、基于显示方式的分类等。

• 数据可视化常用软件分析工具,如Excel的功能、操作方法等。

• 数据可视化实现流程与步骤,包括数据可视化一般过程的四个阶段、七大步骤等。

• 数据可...

Read more

数据科学-Books


《数据科学》书籍摘要

《数据科学》是一本全面介绍数据科学相关知识的书籍,内容涵盖了数据科学的发展历史、数据处理、数据分析、数据可视化等多个方面,为读者提供了一个系统的数据科学学习框架。

书中首先介绍了数据科学的发展历程,阐述了数据科学研究的主要问题以及数据科学的主要方法,强调了R语言在数据科学中的优势。这部分内容为后续深入学习数据科学奠定了基础。

在数据读写方面,详细讲解了如何进行数据的读入和写出,包括直接输入数据、从文件中读取数据、从外部文件读入数据、批量读入数据等,同时也指出了R语言读取文件时常见的错误。这对于数据处理的初学者来说是非常实用的内容。

数据清洗与变换是数据处理中的重要环...

Read more

数据时代:可编程未来的哲学指南


《数据时代:可编程未来的哲学指南》摘要

一、书籍背景与总体架构

《数据时代:可编程未来的哲学指南》由意大利作者科西莫·亚卡托(Cosimo Accoto)所著,由何道宽翻译。这本书深入探讨了在数据时代背景下,技术与社会、哲学之间的交互影响。

从整体架构来看,全书分为多个章节,每个章节围绕一个核心主题展开,从不同角度审视了数据时代的种种现象与背后的哲学思考。

二、核心章节内容剖析

  1. 第一章:你好,新世界

• 这一章节为全书拉开了序幕,描绘了一个被数据和软件所包围的新兴世界。作者强调,我们正处于一个全新的时代,软件和数据如同空气一般无处不在,影响着我们生活的方方面面。

• 作者通过大量实例...

Read more

OpenWhisk-无服务器云原生分布式事件驱动编程服务平台


Apache OpenWhisk是一个开源的无服务器云原生分布式事件驱动编程服务平台。以下是对它的详细介绍:

核心架构

• 动作(Actions):是开发者编写的代码片段,也就是具体的业务逻辑,以函数形式存在,支持多种编程语言。

• 触发器(Triggers):用于定义事件源,如HTTP请求、定时器、消息队列、数据库事件等,当这些事件发生时会触发相应的动作执行。

• 规则(Rules):用于将触发器和动作进行绑定,定义了在何种事件触发时执行哪个动作。

• 包(Packages):将相关的动作、触发器、规则等组合在一起,方便管理和共享,还可以集成一些外部服务或库。

特点

• 事件驱动:通过...

Read more

Apache OpenWhisk学习手册


这本书是《Apache OpenWhisk学习手册》,作者是[美]米歇尔·西巴拉(Michele Sciabarra),由胡亚慧、唐晓、陈新翻译,由中国电力出版社出版。这本书主要讲解了如何使用Apache OpenWhisk进行开发,涵盖了从基础概念到实际应用的多个方面,适合想要深入学习和掌握OpenWhisk技术的读者。

以下是这本书的目录:

第一部分 OpenWhisk开发介绍

  1. 无服务器和OpenWhisk体系结构

  2. 一个简单的OpenWhisk程序

  3. OpenWhisk CLI和JavaScript API

  4. OpenWhisk通用设计模式

  5. OpenWhisk中的集成...

Read more

无服务器架构-


  1. 定义
  2. 无服务器架构(Serverless Architecture)是一种云计算架构模式,它让开发者能够在无需关注服务器的配置、维护和管理的情况下构建和运行应用程序。在这种架构中,云服务提供商负责服务器的管理工作,包括服务器的部署、维护、扩展和安全等方面,而开发者只需专注于编写和部署代码来实现应用程序的功能。

  3. 核心组件和技术

  4. 函数即服务(FaaS - Function as a Service)
    • 这是无服务器架构的关键技术。开发者将应用程序逻辑拆分成一个个独立的函数,这些函数可以被事件触发(如HTTP请求、数据库更新、文件上传等)。例如,在一个电商网站中,一个函数可能负责处理用...

Read more

统计学习


统计学习是一门涉及统计学、计算机科学、数学等多领域的交叉学科,以下是其详细介绍:

基本概念

  • 定义:统计学习是基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习。主要研究如何利用计算机从大量数据中学习有用的知识和规律,以实现对未知数据的预测、分类、聚类等任务。
  • 三要素
    • 模型:是对数据的一种抽象表示,例如线性回归模型、决策树模型、神经网络模型等。
    • 策略:用于衡量模型的好坏,通常基于损失函数来评估模型预测结果与真实结果之间的差异,如均方误差、交叉熵损失等。
    • 算法:指的是求解模型参数的具体方法,如梯度下降算法、牛顿法等,通过不断优化模型参数,使得损失函数达到最...

Read more

SSD模型


SSD(Single Shot MultiBox Detector)模型是一种先进的单阶段目标检测模型,以下是对其更详细的介绍:

网络结构

  • 特征提取网络:通常采用如VGG16、ResNet等预训练的卷积神经网络作为基础网络,对输入图像进行卷积运算以提取高层次的特征信息。
  • 多尺度检测网络:在基础网络的不同层上添加多个卷积层,用于生成不同尺度的特征图,实现多尺度检测。较浅的层生成的特征图可检测较大的物体,较深的层生成的特征图可检测较小的物体。

关键技术

  • 先验框(Default Boxes):在每个特征图上定义一系列不同形状和大小的先验框,其中心点在特征图上均匀分布,每个中心点对应多个先...

Read more