作者文章归档:course

Statsmodels-统计模型库


Statsmodels是一个Python模块,具备以下诸多功能:

功能概述

  • 统计模型估计:提供了用于估计多种不同统计模型的类和函数。无论是常见的线性回归模型、时间序列分析模型(如ARIMA等),还是其他各类复杂的统计模型,都能借助statsmodels中的相关工具进行参数估计等操作,从而帮助用户构建合适的统计模型以拟合数据并进行分析。
  • 统计检验执行:可以开展各种统计检验。比如检验两个变量之间是否存在显著的线性关系(通过t检验等),或者检验一组数据是否符合某种特定的分布(如正态分布检验等)。这些统计检验对于验证假设、评估模型的合理性等方面起着至关重要的作用。
  • 统计数据探索:支持对统计数据...

Read more

GARCH-


GARCH即广义自回归条件异方差模型(Generalized Autoregressive Conditional Heteroskedasticity),它是一种在金融时间序列分析中被广泛应用的计量经济学模型,以下为你详细介绍:

背景与发展

  • 在金融市场中,资产价格(如股票价格、汇率、利率等)往往呈现出波动聚集的现象,也就是在某些时间段内波动较为剧烈,而在另外一些时间段内波动相对平缓,而且波动的大小具有时变性,传统的计量模型很难准确刻画这种特征。为了更好地描述资产价格波动的这种特性,在20世纪80年代末,经济学家罗伯特·恩格尔(Robert F. Engle)提出了自回归条件异方差(A...

Read more

scipy


官网

github

scipy 是一个用于科学计算的 Python 库,建立在 NumPy 之上,提供了大量的数学、科学和工程计算工具。scipy 包含了许多子模块,每个子模块都专注于特定类型的科学计算任务。以下是一些主要的子模块及其功能:

主要子模块

  1. scipy.integrate:数值积分和微分方程求解。
  2. quad:定积分计算。
  3. odeint:常微分方程(ODE)求解。
  4. solve_ivp:常微分方程初值问题求解。

  5. scipy.optimize:优化和拟合。

  6. minimize:最小化标量函数。
  7. root:求解非线性方程组。
  8. curve_fit:非线性最小二乘拟合。

  9. s...

Read more

数据生态系统-Python


数据生态系统是指围绕数据管理和分析的一系列工具、技术和方法的集合。在Python编程语言中,有一个非常成熟和广泛使用的数据生态系统,它涵盖了从数据获取、清洗、处理、分析到可视化的各个环节。以下是一些主要的组件和库:

1. 数据获取

  • Requests:用于发送HTTP请求,从Web API获取数据。
  • BeautifulSouplxml:用于解析HTML和XML文档,从网页中提取数据。
  • Scrapy:一个强大的网络爬虫框架,适用于大规模的数据抓取任务。

2. 数据存储

  • SQLite:轻量级的关系型数据库,适合小型项目。
  • Pandas:提供DataFrame和Series数据结构,...

Read more

streamlit-数据可视化平台


这个仓库是 Streamlit 的代码库,Streamlit 是一个用于快速构建和分享数据应用程序的开源框架,它能够让开发者在几分钟内将 Python 脚本转化为交互式的 Web 应用。以下是对该仓库的详细介绍:

仓库概述

仓库涵盖了 Streamlit 框架的核心代码,包括前端和后端部分,同时包含了大量的测试代码和文档,以确保框架的稳定性和可维护性。

核心功能

  • 快速构建应用:能够将 Python 脚本迅速转化为交互式 Web 应用,可用于构建仪表盘、生成报告或创建聊天应用等。
  • 简单易用:代码编写简单且符合 Python 风格,易于阅读和维护。
  • 实时编辑:在编辑脚本时,应用能够实时更新...

Read more

DIKW-


DIKW模型(Data-Information-Knowledge-Wisdom Model)在数据分析领域有着重要意义,它描述了从原始数据逐步转化为智慧的层级关系,以下为你详细介绍:

模型概述

  • DIKW模型呈现出一种递进式的层次结构,表明了数据、信息、知识和智慧之间的关联与转化过程,是一种帮助人们理解和组织数据处理及分析结果,进而实现更有效决策的概念框架。

各层级含义

  • 数据(Data)

    • 定义:是对客观事物的记录与描述,通常以原始、零散、未加工的形式存在,比如数据库里存储的一串串数字、字符,或者传感器收集到的一个个测量值等。例如,超市收银系统记录下的每一笔交易的时间、商品名称...

Read more

EDA-


EDA(Exploratory Data Analysis)即探索性数据分析,它在数据分析领域有着至关重要的作用,以下是关于它的详细介绍:

定义与目的

  • EDA是指对已有的数据集合进行初步的、全面的探索和分析,旨在了解数据的基本特征、结构、分布情况以及变量之间的关系等,为后续更深入的数据分析(如构建复杂的统计模型、进行机器学习建模等)打下良好基础。它侧重于发现数据中的模式、异常、趋势等信息,帮助分析人员提出合理的假设,选择合适的分析方法和模型。

常用方法与手段

  • 数据可视化

    • 柱状图:适用于比较不同类别数据的数量、频率等情况。例如,要分析不同品牌手机在某一时间段的销量情况,就可以使...

Read more

coze-AI应用平台


Coze 是字节跳动推出的一个 AI 聊天机器人开发平台。

它具有以下特点: - 无代码开发:无论用户是否有编程经验,都可以在该平台上快速创建各种类型的聊天机器人,并将其部署在不同的社交平台和消息应用程序上。 - 插件丰富:集成了大量插件,目前已超过 60 款,涵盖资讯阅读、旅游出行、效率办公、图片理解等 API 及多模态模型,可直接添加到机器人中以扩展其能力,还支持创建自定义插件。 - 数据源多样:提供简单易用的知识库功能来管理和存储数据,支持 bot 与用户自己的数据进行交互。可以上传本地各种格式(如 txt、pdf、docx、excel、cxv 等)的文档,或通过指定 url 获取...

Read more

股票数据分析问题


关于您提供的 CSV 文件,其中包含了股票代码为 "603119.SH" 的一系列交易日数据,您可以问许多不同类型的数据分析问题。以下是一些示例问题:

  1. 基本统计分析
  2. 该股票在提供的数据期间的最高价、最低价、开盘价、收盘价和平均收盘价是多少?
  3. 该股票的日均交易量和日均交易额是多少?

  4. 价格变化分析

  5. 股票价格在数据期间的总变化量和百分比变化量是多少?
  6. 哪一天的价格变化最大,是上涨还是下跌?

  7. 波动性分析

  8. 股票价格的波动性如何?可以通过计算标准差来衡量。
  9. 哪一段时间的价格波动最大?

  10. 交易量分析

  11. 交易量在数据期间的分布情况如何?
  12. 是否存在交易量突然增加或减少的情况...

Read more