分类: 大数据

7 篇文章

CQU DataMining复习 基于ppt
1 数据 1. 数据概述 1.1 数据的概念:定义、分类(定性/定量、静态/动态、在线/离线等)P3P4 1.2 数据的分类:根据性质、时间、网络、位置、来源、范围、格式等进行分类P4 2. 数据内容 2.1 实时数据与历史数据:定义、特点、应用P5 2.2 时态数据与事务数据:定义、特点、区别P6P7 2.3 图形数据与图像数据:定义、特点、应用P8P9 2.4 主题数据与全部数据:定义、区别P10 2.5 空间数据:定义、分类(矢量/栅格)P11 2.6 序列数据和数据流:定义、特点P12 2.7 元数据和数据字典:定义、作用P13 3. 数据属性及数据集 3.1 数据属性:定义、分类(标…
thumbnail
多元统计分析二轮复习 基于ppt
主成分分析 聚类分析 判别分析 H0 多元正态总体的统计推断 T方检验 1 矩阵代数 1.1定义 1.2矩阵运算 1.3行列式 1.4矩阵的逆 矩阵可逆便 行列式不为0 行列式不为0的矩阵叫非奇异矩阵 行列式为0的矩阵叫奇异矩阵 同时不可逆 用化最简行阶梯形也可以做 1.5矩阵的秩 1.6特征值,特征向量,矩阵的迹(这三个概念只有方阵才谈 矩阵的迹 1.7正定矩阵和非负定矩阵 顺序主子式 从矩阵左上角开始,按顺序取1阶、2阶...n阶的行列式 k阶顺序主子式是指:取矩阵左上角的k×k个元素构成的行列式 有趣的性质 主对角线的元素的绝对值 一定比该行 该列 所有其余元素绝对值之和还要大 第一章例…
thumbnail
搜索引擎(vue3+springboot3.4.1+Solr9.7.0+MySQL8.3.0);
https://github.com/mozhongzhou/vue-springboot-solr 写于2024-12-29 架构 前端vue3 后端springboot3.4.1 搜索引擎以及分词系统Solr9.7.0 原始数据库MySQL8.3.0 环境(环境变量等问题不解释) Solr9.7.0 MySQL8.3.0 Maven3.9.9 maven源该改就改,不然很慢 Java 操作系统为Windows11家庭版 配置MySQL(导入测试数据) 按理说生产环节这是最后的步骤,本次放在第一步 利用navicat先建表,然后导入sql,本次测试用sql十分复杂.建议测试时选取简单的数据 …
数据挖掘DataMining
数据挖掘(Data Mining)主要讲述了以下内容: 数据预处理:包括数据清洗、数据集成、数据变换和数据归约等步骤,以确保数据质量和一致性。 模式发现:通过算法和技术从数据中提取有用的模式和知识,如关联规则、频繁模式、序列模式等。 分类和预测:使用分类算法(如决策树、支持向量机、神经网络等)对数据进行分类,并使用回归分析等方法进行预测。 聚类分析:将数据分组,使得同一组内的数据对象相似度高,不同组间的对象相似度低。常用算法有K-means、层次聚类等。 异常检测:识别数据中的异常或异常模式,这在欺诈检测、网络安全等领域非常重要。 数据可视化:通过图形和图表展示数据和挖掘结果,帮助理解和解释数…
thumbnail
多元统计分析
一些废话 涉及线代 矩阵 概率论 多元随机变量 数字特征 期望 相关系数 推荐书目 应用多元统计分析 --王学民 数据统计分析 统计学习方法 李航 1 矩阵代数(基础) 1.1 定义 1.2 矩阵的运算 1.3 行列式 1.4 矩阵的逆 1.5 矩阵的秩 1.6 特征值、特征向量、矩阵的迹 1.7 正定矩阵和非负定矩阵 1.8 特征值的极值问题 2 随机向量 多元分布 数字特征 欧氏距离、马氏距离 随机向量的变换 特征函数 3 多元正态分布 3.1 定义 3.2 性质 3.3 极大似然估计以及估计量的性质 3.4 复相关系数和偏相关系数 3.5 $\overline{x}$和 (n-1)S 的…
thumbnail
重庆大学软件学院python+hadoop实验3
数据科学导论实验报告 实验三 重庆大学软院 一、    实验目的: 为后续上机实验做准备,熟悉常用的Linux 操作和Hadoop 操作 二、    实验要求 见实验内容 三、    开发环境: Windows下Vmware虚拟机搭载Linux Ubunto 64位 四、    实验内容: (一) 熟悉常用的Linux 操作 请按要求上机实践如下linux 基本命令。 cd 命令:切换目录 (1)切换到目录/usr/local (2)去到目前的上层目录 (3)回到自己的主文件…
thumbnail
数据科学导论笔记
数据科学导论 ppt1 概述 有几个 数据:? 数据科学:? 英文为Data Science,简称DS 是关于对(数据进行分析、抽取信息和知识的过程)提供指导和支持的基本原则和方法 三次信息化浪潮 基本标志 1、个人计算机 2、互联网 3、物联网云计算大数据 数据产生方式的变革促成大数据时代的来临 运营式系统阶段数据库 到 用户原创内容阶段web2.0 到感知式系统阶段 大数据发展的三个阶段 大数据的特点 不仅是大量化 而且包含快速化 多样化 价值化4V volume大量 velocity快速 variety多样 value价值化 价值密度低,商业价值高 不仅 ... 而且..... 大数据对…