作者文章归档:course

yfinance源码解析-scrapers-screener-02


yfinance 仓库中,scrapersscreener 是两个不同但相关的功能模块,主要区别和联系如下:

1. 功能定位不同

scrapers(数据抓取器)

  • 定位:底层数据获取工具,负责从雅虎财经页面或 API 中直接抓取原始数据,并解析为结构化格式(如 JSON、DataFrame)。
  • 典型场景:抓取股票持有者信息(如机构持有者、内幕交易数据)、实时行情数据、历史价格等。
  • 示例模块scrapers/holders.py 中的 Holders 类,通过 _fetch_parse 方法从网页或 API 提取原始数据并清洗。

screener(筛选器)

  • 定位:上层...

Read more

yfinance 源码仓库解析-01


这个仓库 yfinance 是一个用于从雅虎财经(Yahoo! Finance)的 API 下载金融和市场数据的 Python 库。以下是对该仓库的详细介绍:

主要特点

  • Pythonic 接口:提供了简洁易用的 Python 接口,方便用户获取金融和市场数据。
  • 多类型数据支持:可以获取单个股票(Ticker)、多个股票(Tickers)的数据,还能下载多只股票的市场数据(download)。
  • 丰富的功能模块:包括获取市场信息(Market)、实时流式数据(WebSocketAsyncWebSocket)、搜索报价和新闻(Search)、获取行业和板块信息(SectorInd...

Read more

gitdiagram-任意 GitHub 仓库转化为交互式图表


这个仓库名为 gitdiagram,其主要功能是能在数秒内将任意 GitHub 仓库转化为交互式图表,方便用户对仓库结构进行可视化。以下是对该仓库的详细介绍:

功能特性

  • 即时可视化:可将任意 GitHub 仓库结构转换为系统设计或架构图。
  • 交互性:用户点击图表中的组件,能够直接跳转到对应的源文件和相关目录。
  • 快速生成:借助 OpenAI o4 - mini 模型,实现快速且准确的图表生成。
  • 可定制化:支持用户通过自定义指令对图表进行修改和重新生成。
  • API 访问:提供公共 API 用于集成,不过此功能仍在开发中(WIP)。

技术栈

  • 前端:采用 Next.js、TypeScript、...

Read more

基于 Python 的分布式并发写入方案


以下是基于Python、Redis队列和MongoDB的分布式并发写入方案,适用于5000个接口数据处理:

方案架构

  1. 技术栈

• 任务队列:Redis(List结构实现FIFO队列,支持分布式消费)。

• 并发处理:Python多进程/线程(或异步框架如FastAPI+协程)。

• 存储层:MongoDB(分片集群或副本集,支持高并发写入)。

核心步骤

  1. 数据入队

• 接口请求:

◦ 用Python遍历5000个接口,将每个接口URL/参数作为任务存入Redis队列(如task_queue)。

◦ 示例代码: import redis r = redis.Redis(host='l...

Read more

FineBI-大数据分析工具



一段话总结

FineBI是一款强大好用、人人可用的大数据分析工具,能连接多种数据源,具备数据编辑、可视化、分享协作等功能,内置50+图表,可实现一站式主题分析,比传统数据分析提效50%,图表可视化效率较传统BI提升19%。它拥有丰富函数,能智能分析数据变化原因,还可设置预警。该工具能满足不同岗位人员的数据分析需求,提供丰富业务场景模板和案例,获得30000+企业认可,支持免费体验。


## **产品功能**
- 连接多种数据源,一键接入数据库表或导入Excel
- 可视化编辑数据,无需SQL,含多种新增列功能
- 内置50+图表,支持联动钻取特效
- 多人协同编辑仪表板,复用报表,一键...

Read more

AI机器人群聊-


这个仓库 botgroup.chat 是一个基于 React 和 Cloudflare Pages 构建的多人 AI 聊天应用,同时也支持服务器版的一键 Docker 部署。以下是对该仓库的详细介绍:

项目概述

这是一个多人 AI 聊天应用,支持多个 AI 角色同时参与对话,提供类似群聊的交互体验。用户可以在应用中与多个 AI 角色进行实时交流,享受流式响应。该应用具有群组管理、AI 角色禁言、Markdown 格式支持、数学公式显示等功能,界面美观且支持移动端。

功能特点

  • 多 AI 角色对话:支持多个 AI 角色同时参与对话。
  • 实时流式响应:用户与 AI 交流时可获得实时流式响应。
  • ...

Read more

CausalStock: Deep End-to-end Causal Discovery for News-driven Stock Movement Prediction-论文


这篇论文提出了一种名为CausalStock的模型,用于预测受新闻影响的多只股票价格走势,核心内容如下: 1. 研究背景:在预测多只股票价格走势时,现有方法存在两个问题。一是股票关系常为单向,以往基于相关性的关系建模不合适,因果关系更能准确反映股票间影响;二是新闻数据噪声大,传统文本挖掘模块难以提取有效信息。 2. 创新点 - 因果关系发现:设计了与时间滞后相关的因果发现模块,能根据时间滞后直观地建立股票间的因果关系,比以往不考虑时间滞后的方法更适合股票数据。 - 新闻信息提取:提出基于大语言模型(LLM)的去噪新闻编码器。它能从多个角度给新闻文本打分,有效去除噪声,提取...

Read more

归一化-sklearn.preprocessing.MinMaxScaler-数据预处理工具


sklearn.preprocessing.MinMaxScaler 是 scikit-learn 库中的一个数据预处理工具,用于将特征数据按比例缩放到指定的范围,通常是 [0, 1] 或 [-1, 1]。这种归一化处理有助于消除特征之间的尺度差异,使得各特征在同一量级上,从而提高机器学习模型的训练效率和性能。


🔍 功能说明

MinMaxScaler 对每个特征(列)进行线性变换,使其值缩放到指定的范围默认情况下,缩放范围是 [0, 1],但可以通过 feature_range 参数设置为其他范围,如 [-1, 1] 变换公式如下 [ X_{\text{scaled}...

Read more

Apache Calcite-动态数据管理框架


Apache Calcite是一个动态数据管理框架,从仓库的文件和代码片段可以看出它具备以下主要功能:

核心功能

  1. SQL解析与验证:提供了行业标准的SQL解析器和验证器,能够解析和验证SQL语句的正确性,确保输入的SQL符合规范。
  2. 可定制的优化器:拥有可定制的优化器,支持插入自定义规则和成本函数。这使得开发者可以根据具体的业务需求和数据特点,对查询进行优化,提高查询效率。
  3. 代数运算符:包含逻辑和物理代数运算符,为SQL查询的执行提供了基础的操作单元。这些运算符可以将SQL查询转换为代数表达式,便于后续的优化和执行。
  4. SQL与代数的转换:提供了各种从SQL到代数,以及从代数到SQL的转换...

Read more