作者文章归档:course

智能数据分析


智能数据分析(Intelligent Data Analysis, IDA)概述

一、定义与核心内涵

智能数据分析是融合人工智能(AI)、机器学习(ML)、深度学习(DL)、统计学等技术,对海量数据进行自动化解析、建模和预测的过程。其核心目标是从复杂数据中提取隐藏规律、预测趋势,并为决策提供智能化支持,解决传统数据分析中人工干预多、时效性差、预测能力不足等问题。

二、核心技术与工具

  1. 机器学习算法
  2. 监督学习:回归分析(如线性回归、随机森林)、分类算法(如SVM、逻辑回归),用于预测连续值或离散类别(如客户流失预测)。
  3. 无监督学习:聚类(如K-means)、降维(如PCA)、关联规...

Read more

SOP概述


SOP概述:标准化管理的核心工具

一、SOP的定义与本质

SOP(Standard Operating Procedure)即标准作业程序,是将某一事件的标准操作步骤和要求以统一的格式进行描述,用于指导和规范日常工作的程序性文件。其本质是通过对流程的分解、优化与固化,将经验转化为可复制的标准化操作指南,确保不同人员在相同条件下能执行一致的动作,产出稳定的结果。从制造业的流水线操作到服务业的客户接待,从医疗领域的手术流程到IT行业的代码部署,SOP已成为现代组织提升效率、控制风险的核心管理工具。

二、SOP的起源与发展

SOP的理念可追溯至20世纪初科学管理之父弗雷德里克·泰勒的“动作...

Read more

采集器-数据采集功能-需求说明书


基于云计算的动态数据采集方案需求说明书

1 引言

1.1 编写目的

本需求说明书旨在明确基于云计算的动态数据采集方案的详细需求,为方案的设计、开发、测试和实施提供准确的指导依据,确保各相关方对项目的目标、功能、性能、技术要求等有清晰一致的理解。该文档适用于软件开发团队、项目管理人员、测试人员以及与项目相关的业务部门人员。

1.2 项目背景

随着信息技术的飞速发展,企业和组织面临的数据量呈爆炸式增长,数据来源也日益多样化,包括传感器、物联网设备、业务系统、社交媒体等。传统的数据采集方式在面对海量、动态变化的数据时,存在扩展性差、实时性不足、成本高等问题。云计算技术凭借其强大的计算能力、存储...

Read more

交易日历-复盘功能


交易日历 - 复盘功能需求描述文档 ** 一、引言 (一)编写目的 本文档旨在清晰、准确地描述交易日历中复盘功能的需求,为产品设计、开发、测试等团队提供明确的指导,确保各团队对该功能的理解一致,从而高效地完成功能的实现与验证。同时,也可作为后续产品维护和升级的参考依据。 (二)背景 在股票投资领域,投资者需要对每日的交易行为进行记录和分析,以便总结经验、优化策略。目前,市场上的交易日历工具虽然能够记录交易日期等基本信息,但对于详细的股票买入卖出记录及周末复盘功能的支持不够完善。为了满足投资者对交易记录和复盘分析的需求,特提出在交易日历中增加复盘功能,实现每日交易记录的详细录入和周末的统一...

Read more

Aktools-解析动态接口调用-002


让我详细解析动态接口调用的实现。这个功能主要在 core/api.py 中实现,我们来看关键部分:

  1. 首先,看看公开接口的实现(private 接口实现类似,只是多了认证):
@app_core.get(path="/public/{item_id}", description="公开接口", summary="该接口主要提供公开访问来获取数据")
def root(request: Request, item_id: str):
    """
    接收请求参数及接口名称并返回 JSON 数...

Read more

aktools源码分析-001


首先让我看看项目的基本结构。

Ran tool 看起来这是一个 Python 项目,让我们进一步了解主要的源代码实现。我会先查看主要的源码目录 aktools/

Ran tool 这是一个比较完整的 Python 项目,让我们来看看主要的实现部分:

  1. 先看看入口文件 main.py

Read file: aktools/main.py 让我们继续看看核心 API 的实现:

Read file: aktools/core/api.py 基于对源码的分析,我来为你解释这个项目的主要实现过程:

  1. 项目概述: 这是一个名为 AKTools 的项目,主要目的是为 AKShare(一个金融数...

Read more

multiprocessing-set_start_method("spawn")


在 Python 里,借助 multiprocessing 模块能够开展多进程编程。而 set_start_method("spawn") 这一操作,能够对新进程的启动方式加以设定。下面为你详细介绍其具体用法和相关注意要点:

启动方式的类型

  • spawn:主进程会生成一个全新的 Python 解释器进程。在这种方式下,子进程仅仅会继承那些运行进程对象的 run() 方法所必需的资源。像全局变量的设置这类非必要资源,是不会被继承的。这种启动方式相对安全,但速度较慢,在 Windows 系统中是默认的启动方式。
  • fork:主进程会通过 os.fork() 来创建子进程。子进程会复制父进程的所...

Read more

OpenCSG-开源的大模型资产管理平台



OpenCSG(开放传神)是一个致力于打造Hybrid Huggingface+开源社区的平台,旨在通过大语言模型赋能开发者,其核心平台CSGHub是开源的大模型资产管理平台,支持模型、数据集等资产的全生命周期管理。平台汇聚了11万+模型,包括自研的csg-wukong-1B(1B参数、3G内存可部署)、多模态模型Qwen2.5-Omni-7B(支持文本、图像、音频、视频多模态实时交互)、推理模型QwQ-32B(325亿参数、13万token上下文)以及DeepSeek-R1/R1-Zero(强化学习推理)、DeepSeek-V3(6710亿参数混合专家模型)等。此外,平台提供Star...

Read more

TimesFM-时间序列预测-03001


以下是关于谷歌时间序列预测基础模型 TimesFM 的详细介绍,基于搜索结果的综合分析:


1. 模型概述

TimesFM 是谷歌研发的专为时间序列预测设计的 仅解码器(decoder-only)基础模型,参数规模为 2亿(200M),在包含 1000亿个真实世界时间点 的多样化数据集上预训练而成。其核心目标是通过大规模预训练实现 零样本(zero-shot)预测,即在无需微调的情况下直接应用于新任务,性能媲美甚至超越传统监督学习方法。


2. 核心架构与创新

架构设计

  • 分块(Patch)处理:将时间序列分割为连续的非重叠块(如32个时间点为一个输入块),每个块通过残差块转换为向量,并...

Read more

股票公司官网产品信息爬取系统需求说明书


股票公司官网产品信息爬取系统需求说明书

一、引言

1.1 编写目的

本文档旨在为股票公司官网产品信息爬取系统提供完整的需求定义和功能架构设计,指导系统开发团队理解项目目标、功能需求和技术实现路径,确保系统开发符合预期业务需求。

1.2 背景

在金融信息分析领域,了解上市公司的产品信息对于投资者、分析师和研究人员至关重要。然而,上市公司官网结构各异,产品信息分散,手动收集和整理效率低下。开发一套自动化爬取系统,能够根据股票代码和名称自动提取公司官网产品信息,将极大提升信息获取的效率和准确性。

1.3 定义

  • 股票代码:上市公司在证券交易所的唯一标识代码
  • 结构化数据:经过整理和规范的数据格式...

Read more