重庆大学软件学院python+hadoop实验3
数据科学导论实验报告 实验三 重庆大学软院 一、 实验目的: 为后续上机实验做准备,熟悉常用的Linux 操作和Hadoop 操作 二、 实验要求 见实验内容 三、 开发环境: Windows下Vmware虚拟机搭载Linux Ubunto 64位 四、 实验内容: (一) 熟悉常用的Linux 操作 请按要求上机实践如下linux 基本命令。 cd 命令:切换目录 (1)切换到目录/usr/local (2)去到目前的上层目录 (3)回到自己的主文件…
数据科学导论笔记
数据科学导论 ppt1 概述 有几个 数据:? 数据科学:? 英文为Data Science,简称DS 是关于对(数据进行分析、抽取信息和知识的过程)提供指导和支持的基本原则和方法 三次信息化浪潮 基本标志 1、个人计算机 2、互联网 3、物联网云计算大数据 数据产生方式的变革促成大数据时代的来临 运营式系统阶段数据库 到 用户原创内容阶段web2.0 到感知式系统阶段 大数据发展的三个阶段 大数据的特点 不仅是大量化 而且包含快速化 多样化 价值化4V volume大量 velocity快速 variety多样 value价值化 价值密度低,商业价值高 不仅 ... 而且..... 大数据对…
操作系统笔记
磁盘空间分配方式 连续分配:在磁盘上为每个文件分配一组连续的块。这种方法简单且读写效率高,但容易产生磁盘碎片。 链接分配:文件的各个部分分散存储在磁盘上,每个部分的位置信息存储在前一个部分中。这种方法避免了碎片问题,但随机访问性能较差。 索引分配:所有文件块的索引信息存储在一个单独的索引块中。这种方法支持快速随机访问,同时减少了碎片问题,但需要额外的空间存储索引信息。 硬件保护的方式 二态模式:操作系统通过用户模式和内核模式的切换来保护关键系统资源。 特权指令:只有在内核模式下才能执行的指令,用于保护系统的关键操作。 存储器保护:(memory protection)使用内存管理单元MMU C…
算法设计与分析笔记
1、概述 2、递归 3、分治法-基于递归思想 二路归并 T(n)=O(nlogn) 自底向上 自顶向下 描述一个算法 解决问题的步骤 例: 3.3.1查找最大和次大元素T=O(n) 分治法求最大和次大元素的思路可以简要概括为以下几个步骤: 分解:将当前问题的数据集分成两个大小大致相等的子集. 解决:递归地在两个子集中分别找到最大和次大元素. 合并:比较两个子集各自的最大元素,确定整个数据集的最大元素.次大元素可能是以下几种情况之一:两个子集中较小的最大元素.两个子集中的次大元素(如果最大元素来自同一个子集).对这些候选元素进行比较,确定整个数据集的次大元素.4、直接解决:如果数据集足够小,直接…