分类目录归档：个人成长

Practical Data Analysis - Books

180 views

Getting Started

Workink with Data

Data Visualization

Text Classification

Similarity-based Image Retrieval

Simulation of Stock Prices

Predicting Gold Prices

Working with Support Vector Machines

Modeling Infectious Disease with Cellular Automate

Sentiment Analy...

Hands-On Exploratory Data Analysis with Python - Books

198 views

The Fundamentals of EDA

Understanding data science

Comparing EDA with classical and Bayesian analysis

Data Transformer

Descriptive Statistics

Introducing correlation

understanding the time series dataset

Model Development and Evaluation

Hypothesis Testing and Regression

Hands-On Graph Analytics with Neo4j -Books

235 views

Graph Modeling with Neo4j

Graph Databases

The Cypher Qqery Language

Empowering Your Business with Pure Cypher

Graph Algorithms

The Graph Data Science Library and Path Finding

Node Importance

Community Detection and Similarity Measures

Machine Learning on Graphs

Using Graph-based Features ...

若监督学习实用指南-用更少的数据做更多的事情-Books

226 views

弱监督介绍

使用Snorkel 框架深入数据编程

标记行为

使用Snorkel 标记的数据集进行文本分类

使用Snorkel标注的数据集进行图像分类

扩展性和分布式训练

深度学习之模型优化-核心算法与案例实践

288 views

引言

模型性能评估

模型可视化

轻量级模型设计

模型剪枝

模型量化

迁移学习与知识蒸馏

自动化模型设计

模型优化与部署工具

全面解析时间序列分析与预测-v01

273 views

全面解析时间序列分析与预测

1. 时间序列分析的核心概念与理论基础

时间序列分析是数据科学和统计学中的一个核心领域，专注于研究按时间顺序排列的数据点。这些数据点通常以固定的时间间隔（如每日、每周、每月）进行测量和记录，其本质特征是数据值会随着时间的推移而发生变化。时间序列分析的目标不仅仅是描述历史数据，更重要的是理解其内在结构，并基于这种理解对未来进行预测。这一过程在金融、经济、气象、零售、医疗等众多领域都有着广泛的应用。例如，金融分析师利用时间序列模型预测股票价格的走势，气象学家用它来预报未来的天气变化，而零售商则通过分析历史销售数据来优化库存管理和制定营销策略。时间序列数据可以被...

神经网络与机器学习-books

264 views

导言

Rosenblatt 感知器

回归建模

最小均方算法

多层感知器

核方法和径向基函数网络

支持向量机

主成分分析

自组织映射

信息论学习模型

源于统计力学的随机方法

动态规划

神经动力学

动态系统状态估计的贝叶斯滤波

动态驱动递归网络

统计学习要素-机器学习中的数据挖掘，推断与预测-Books

208 views

概述

监督学习概述

回归的线性方法

分类的线性方法

基展开与正则化方法

核平滑方法

模型的评估和选择

模型的推断和平均

加性模型，树和相关方法

Boosting 和加性树

神经网络

支持向量机与柔性判别分析

原型方法与最近邻

非监督学习

随机森林

集成学习

无向图模型

高维问题

精通特征工程-Feature Engineering For Machine Learning-Books

245 views

机器学习的流程

简单而又奇妙的数值

文本数据：扁平化，过滤和分块

特征缩放的效果：从词袋到tf-idf

分类变量：自动化时代的数据计数

数据降维：使用PCA 挤压数据

非线性特征话与k-均值模型堆叠

自动特征生成：图像特征提取和深度学习

回到特征：建立学术论文推荐器

附录A：线性建模与线性代数基础

链式法则：微积分中看不见的纽带

310 views