作者文章归档:course

用户意图识别


用户意图识别是自然语言处理(NLP)领域的关键任务,其核心目标是从用户输入的文本、语音等信息中准确理解其真实需求与目的。以下将从定义、应用场景、技术方法、挑战及发展趋势等方面展开详细介绍:

一、用户意图识别的定义与核心目标

  • 定义:通过分析用户的语言表达(如查询、指令、对话等),推断其背后的真实需求或意图类别。例如,用户说“帮我订明天去北京的机票”,意图可识别为“机票预订”。
  • 核心目标:将非结构化的用户输入转化为结构化的意图标签,为后续的任务处理(如信息检索、智能回答、自动化操作等)提供明确指引。

二、主要应用场景

  1. 智能客服与聊天机器人
  2. 识别用户咨询意图(如“查询物流”“投诉问题...

Read more

股票分析系统的功能矩阵-V01


股票分析系统的功能矩阵

股票分析系统是一个综合性的工具,它集成了多种功能和技术,以帮助投资者分析股票市场数据,掌握市场趋势,评估股票的风险和价值,并制定科学的投资策略。以下是股票分析系统的功能矩阵,包括系统的具体功能、模块划分、技术实现以及如何满足用户需求。

1. 系统功能

1.1 数据采集

  • 功能描述:系统能够从财经网站、API接口等渠道采集股票数据,包括实时行情、历史数据、财务数据等。
  • 技术实现:使用网络爬虫技术(如 requestsBeautifulSoup)和API调用(如Tushare、AKShare)。
  • 用户需求满足:为用户提供全面的股票数据,帮助他们进行深入的市场分析...

Read more

交易系统撮合机制-


交易系统撮合机制与主动/被动交易行为的深度解析

一、撮合机制的底层逻辑与核心规则

  1. 基本原则:价格优先+时间优先的延伸应用
  2. 价格优先的细化
    • 买入时,订单价格≥卖方挂单价格则可成交,价格越高越优先;
    • 卖出时,订单价格≤买方挂单价格则可成交,价格越低越优先。
  3. 时间优先的场景:相同价格的订单,以交易所系统记录的申报时间先后排序,先到先得(如A股的集合竞价阶段,时间精度可到毫秒级)。

  4. 撮合引擎的核心算法

  5. 订单簿(Order Book)机制:实时记录所有未成交的买卖挂单,按价格高低排序(买盘从高到低,卖盘从低到高),形成“价格-数量”的队列。
  6. 成交逻辑示...

Read more

股票画像系统需求说明书大纲-V01


股票画像系统需求说明书大纲

1. 引言 (Introduction) * 1.1 文档目的 (Purpose of Document): 明确本文档的目标,即为股票画像系统的设计、开发和验收提供详细的功能与非功能性需求说明。 * 1.2 系统范围 (Scope of System): 清晰界定股票画像系统涵盖的功能边界(如:覆盖哪些市场、哪些类型股票、提供哪些维度的画像、是否包含历史回溯、预测分析等),以及不包括的功能。 * 1.3 目标用户 (Target Audience): 描述系统的预期用户(如:个人投资者、专业分析师、基金经理、风险管理人员、...

Read more

self-llm-开源大模型食用指南


这个仓库名为 self-llm,是一个围绕开源大模型、针对国内初学者、基于 Linux 平台的大模型教程项目。以下是对该仓库的详细介绍:

项目概述

本项目旨在为更多普通学生、研究者提供开源大模型的全流程指导,简化开源大模型的部署、使用和应用流程,让开源、自由的大模型更好地融入普通学习者的生活。其主要内容涵盖环境配置、本地部署、高效微调等技能的教学。

项目主要内容

  1. 开源 LLM 环境配置指南:基于 Linux 平台,针对不同模型要求提供详细的环境配置步骤。
  2. 主流开源 LLM 部署使用教程:包括国内外主流的开源 LLM,如 LLaMA、ChatGLM、InternLM 等。
  3. 开源 LLM ...

Read more

全模态智能体自动学习网站内容并自我强化的研究与实践


全模态智能体自动学习网站内容并自我强化的研究与实践

** 摘要 本文围绕全模态智能体自动学习网站内容并实现自我强化展开深入探讨。通过阐述全模态智能体的核心概念、关键技术,剖析其自动学习网站内容的原理流程与自我强化机制,结合实际应用案例分析其价值,同时探讨面临的挑战与解决方案,展望未来发展趋势,旨在为该领域的研究与实践提供全面参考。 一、引言 在人工智能技术迅猛发展的当下,智能体的研究与应用不断迈向新高度。从早期简单的规则型智能体,到如今基于深度学习的复杂智能体,其处理信息的能力与智能化水平持续提升。随着互联网信息的爆炸式增长,网站成为海量数据的重要载体,如何让智能体高效自动学习网站主题内...

Read more

stocks-insights-ai-agent-股票相关新闻和金融数据洞察-开源-量化框架-09009


这个仓库 stocks-insights-ai-agent 是一个用于提取股票市场相关新闻和金融数据洞察的项目。它利用 Agentic 检索增强生成(RAG)工作流,结合大语言模型(LLMs)、ChromaDB 向量数据库、LangChain、LangChain 表达式语言(LCEL)和 LangGraph 来提供全面的分析。

主要特性

  1. 股票表现可视化:展示所选股票的历史表现图表。
  2. 特定属性数据检索:获取特定股票的详细属性信息。
  3. 新闻聚合:提供特定股票或公司的通用新闻或专题文章。

项目结构

stocks-insights-ai-agent/
├── LICENSE.md
├── RE...

Read more

stock-量化交易系统-开源-量化框架-09008


这个仓库主要围绕股票、基金等金融投资领域的量化交易相关内容,为投资者提供了一系列工具和策略来辅助炒股和基金投资。以下是对该仓库的详细介绍:

项目结构

项目的目录结构和各部分功能如下:

  • analysis/:数据分析部分,包含对次新板块涨停强度分析、股票诊断、IPO发行速度与指数相关性分析以及A股涨停板封单金额统计等功能。
  • datahub/:数据采集部分,负责从各个数据源采集股票和基金相关的数据,并存储到数据库中。
  • fund/:基金相关的分析部分,包括监控LOF、ETF场内份额变动,获取持仓详情以及分析清仓基金等功能。
  • futu/:富途牛牛接口的基本用法示例。
  • hk_stock/:港股部分...

Read more

Thordata-采集解决方案的网站


Thordata 是一家专注于提供高质量代理服务和网络数据采集解决方案的网站,其功能丰富且强大,能满足不同用户在数据获取、网络访问等方面的多样化需求,以下是对其主要功能的详细介绍:

一、代理服务

  1. 住宅代理(Residential Proxies)
    • 核心功能:提供超过6000万个真实住宅IP,覆盖全球195+国家和地区,如美国、英国、德国等,支持按国家、城市甚至ISP级别进行地理位置定位。
    • 性能优势:具备99.99%的高可用性和小于0.5秒的响应时间,可模拟人类浏览行为,降低被目标网站封锁的风险,适合大规模网络数据抓取、AI训练数据收集等场景。
    • 计费方式:按流量收费,起价为$0.65/G...

Read more

HowToCreateHomunculus-从零开始学习构建智能对话系统


这个仓库名为 HowToCreateHomunculus,主要聚焦于基于深度学习的对话系统的实现与探索,包含了从简单对话系统到结合数据库和知识图谱的对话系统等多个不同复杂度的项目,为构建对话系统提供了丰富的实践案例和理论指导。以下是对该仓库的详细介绍:

项目概述

项目源于对构建与人类无异的对话系统的向往,受《钢之炼金术师》中瓶中小人角色启发而开展。旨在探索基于深度学习的对话系统的构建方法,并记录学习过程,目前网上缺乏统一鲜明的路线,此项目可作为学习参考。

前置知识

  • 具备编程基础,推荐同时掌握 tensorflowpytorch
  • 本项目基于 NLPBeginner 开发,可先大致...

Read more