大数据 – 漠中洲的博客小站

CQU DataMining复习基于ppt

2025-1-05 15:27

|

13

|

0

|

大数据

|

2025-1-06 19:06

|

mozhongzhou

10053 字

|

29 分钟

1 数据 1. 数据概述 1.1 数据的概念：定义、分类（定性/定量、静态/动态、在线/离线等）P3P4 1.2 数据的分类：根据性质、时间、网络、位置、来源、范围、格式等进行分类P4 2. 数据内容 2.1 实时数据与历史数据：定义、特点、应用P5 2.2 时态数据与事务数据：定义、特点、区别P6P7 2.3 图形数据与图像数据：定义、特点、应用P8P9 2.4 主题数据与全部数据：定义、区别P10 2.5 空间数据：定义、分类（矢量/栅格）P11 2.6 序列数据和数据流：定义、特点P12 2.7 元数据和数据字典：定义、作用P13 3. 数据属性及数据集 3.1 数据属性：定义、分类（标…

多元统计分析二轮复习基于ppt

2024-12-29 14:15

|

23

|

0

|

大数据

|

2025-1-02 14:13

|

mozhongzhou

4235 字

|

13 分钟

主成分分析聚类分析判别分析 H0 多元正态总体的统计推断 T方检验 1 矩阵代数 1.1定义 1.2矩阵运算 1.3行列式 1.4矩阵的逆矩阵可逆便行列式不为0 行列式不为0的矩阵叫非奇异矩阵行列式为0的矩阵叫奇异矩阵同时不可逆用化最简行阶梯形也可以做 1.5矩阵的秩 1.6特征值,特征向量,矩阵的迹(这三个概念只有方阵才谈矩阵的迹 1.7正定矩阵和非负定矩阵顺序主子式从矩阵左上角开始，按顺序取1阶、2阶...n阶的行列式 k阶顺序主子式是指：取矩阵左上角的k×k个元素构成的行列式有趣的性质主对角线的元素的绝对值一定比该行该列所有其余元素绝对值之和还要大第一章例…

搜索引擎(vue3+springboot3.4.1+Solr9.7.0+MySQL8.3.0);

2024-12-16 17:00

|

42

|

0

|

大数据,计算机应用

|

2024-12-29 2:21

|

mozhongzhou

1812 字

|

24 分钟

https://github.com/mozhongzhou/vue-springboot-solr 写于2024-12-29 架构前端vue3 后端springboot3.4.1 搜索引擎以及分词系统Solr9.7.0 原始数据库MySQL8.3.0 环境(环境变量等问题不解释) Solr9.7.0 MySQL8.3.0 Maven3.9.9 maven源该改就改,不然很慢 Java 操作系统为Windows11家庭版配置MySQL(导入测试数据) 按理说生产环节这是最后的步骤,本次放在第一步利用navicat先建表,然后导入sql,本次测试用sql十分复杂.建议测试时选取简单的数据 …

NLP实验判断感情

2024-12-16 16:48

|

8

|

0

|

基础,大数据,计算机应用

|

2024-12-16 16:50

|

mozhongzhou

3215 字

|

20 分钟

实验目的众所周知，人类自然语言中包含了丰富的情感色彩：表达人的情绪（如悲伤、快乐）、表达人的心情（如倦怠、忧郁）、表达人的喜好（如喜欢、讨厌）、表达人的个性特征和表达人的立场等等。情感分析在商品喜好、消费决策、舆情分析等场景中均有应用。利用机器自动分析这些情感倾向，不但有助于帮助企业了解消费者对其产品的感受，为产品改进提供依据；同时还有助于企业分析商业伙伴们的态度，以便更好地进行商业决策。学习对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。使用仪器、材料环境：Python 3.12.4 (Anaconda3）开发工具：Visual Studio Code 实验过程原始记…

机器学习二轮复习框架基于(CQU复习ppt by gaomin)

2024-12-16 0:33

|

81

|

0

|

大数据,计算机应用

|

2025-1-05 15:32

|

mozhongzhou

15479 字

|

44 分钟

一个有趣的概念 1简要介绍xx模型的定义给出简要例子说明,不用代码,手动模拟即可注意在解释的过程中,要对公式的每个符号进行说明解释,要保证科学研究的严谨性 2为了求解这个模型的最优参数,有哪些方法? 给出简要例子说明,不用代码,手动模拟即可注意在解释的过程中,要对公式的每个符号进行说明解释,要保证科学研究的严谨性基础知识要求1：基本概念要求2：数据集划分要求3：性能度量要求4：可以描述任务之间的关系要求5：可以描述各算法的特点，同类任务不同算法的特点及其之间的区别等基本概念：这是指你需要理解机器学习的基础知识和术语。例如，什么是监督学习和无监督学习，什么是特征和标签，什么是模型训…

机器学习3h

2024-12-14 17:19

|

20

|

0

|

基础,大数据

|

2024-12-17 22:27

|

mozhongzhou

2845 字

|

8 分钟

机器学习简介机器学习概括机器学习模型有监督模型（单模型线性模型 kmeans 决策树神经网络支持向量机）无监督模型（聚类降维）概率模型（EM MCMC 贝叶斯）机器学习分类监督学习分类回归无监督学习聚类降维机器学习的方法和流程模型机器学习首先考虑使用什么模型模型分为概率模型和非概率模型概率模型：决策树朴素贝叶斯非概率模型：感知机支持向量机 Kmeans 神经网络按判别函数的线性与否分为线性模型和非线性模型线性模型：感知机线性支持向量机 Kmeans 非线性模型：核支持向量机神经网络损失函数模型预测出来的和真实的有差距…

吴恩达机器学习

2024-11-15 14:20

|

26

|

0

|

大数据

|

2024-11-15 14:57

|

mozhongzhou

0 字

|

几秒读完

这篇文章没有摘要

数据挖掘DataMining

2024-10-11 8:41

|

69

|

0

|

大数据

|

2024-10-11 9:21

|

mozhongzhou

393 字

|

2 分钟

数据挖掘（Data Mining）主要讲述了以下内容：数据预处理：包括数据清洗、数据集成、数据变换和数据归约等步骤，以确保数据质量和一致性。模式发现：通过算法和技术从数据中提取有用的模式和知识，如关联规则、频繁模式、序列模式等。分类和预测：使用分类算法（如决策树、支持向量机、神经网络等）对数据进行分类，并使用回归分析等方法进行预测。聚类分析：将数据分组，使得同一组内的数据对象相似度高，不同组间的对象相似度低。常用算法有K-means、层次聚类等。异常检测：识别数据中的异常或异常模式，这在欺诈检测、网络安全等领域非常重要。数据可视化：通过图形和图表展示数据和挖掘结果，帮助理解和解释数…

Machine Learning Project1

2024-10-08 22:19

|

73

|

0

|

大数据

|

2024-10-09 9:45

|

mozhongzhou

664 字

|

5 分钟

0、前期准备配置anaconda3的环境变量使用anaconda3 作为python包管理器，把包都存在统一集成环境中，后续在IDE中使用anaconda3的python解释器即可在创建项目时，使用已有conda的python解释器 1、实现线性回归算法自己构造数据集 1.1、代码 import numpy as np import matplotlib.pyplot as plt # 设置中文字体，否则图片上的中文会显示成方框 plt.rcParams['font.sans-serif'] = ['SimHei'] # 使用黑体 plt.rcParams['a…

机器学习

2024-9-02 10:28

|

49

|

0

|

大数据,计算机应用

|

2024-9-25 10:36

|

mozhongzhou

3747 字

|

11 分钟

有数据整理数据选择模型跑模型评价模型优化模型超参预测 —————————————————————————— 推荐书目机器学习-周志华机器学习公式详解统计学习方法李航机器学习理论导引 Main content 涉及 matlab python 回归模型线性回归对数几率回归降维方法主成分分析线性判别分析支持向量机决策树神经网络 K均值聚类 1模型评估与选择第一章略讲，介绍了假设空间 1.2、基本术语 1.3、假设空间 2模型评估与选择前三节较为重要数据为王，数据量越大越好 2.1经验误差与过拟合 2.1.1留出法（划分为两部分）留出法是一种简单的模型…

分类： 大数据

分类：大数据