一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 停用词,可网盘下载stopwords.txt,filter(), 长度小于2的词filter()
一、词频统计 A. 分步骤实现 1、准备文件 (1)下载小说或长篇新闻稿 (2)上传到hdfs上 2、读文件创建RDD 3、分词 4、排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长度小于2
一、词频统计 1.分步骤实现 1).准备文件 1.下载小说或长篇新闻稿 2.上传到hdfs上 3.读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长度小于2的词filter() 统计
一、词频统计 A. 分步骤实现 准备文件 1.下载小说或长篇新闻稿 2.上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长度小于2的词filter() 统计词频 按词
1. 先搭建JAVA环境 后续 直接点击 下一步,直到安装完成即可 2. kitfd 个人网盘环境部署 1. 先下载文件, 并解压 2. 直接双击 jar 即可 3. 访问 个人网盘 输入 自己电脑的 ip地址加上端口号 即可访问 例如: 192.168.1.30:8080 查看自己电脑ip地址 win+r 输入 cmd 在
一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap() 停用词,可网盘下载stopwords.txt,filter() 长度小于2的词filter() 统计词频 按词频排序 输出到文件
一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长度小于2的词filter()
一、词频统计 A. 分步骤实现 1.准备文件,下载小说或长篇新闻稿 2.上传到hdfs上 3.读文件创建RDD 4.分词 5.排除大小写lower(),map() 6.标点符号re.split(pattern,str),flatMap(),停用词,可网盘下载
一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长度小于2的词filter()
一、词频统计 A. 分步骤实现 1.准备文件 1.下载小说或长篇新闻稿 2.上传到hdfs上 2.读文件创建RDD 3.分词 4.排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(),
一、词频统计 A. 分步骤实现 1.准备文件 (1)下载小说或长篇新闻稿 (2)上传到hdfs上 2.读文件创建RDD 3.分词 4.排除大小写lower(),map()标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(),长度小于2的词filter()
一、词频统计 A. 分步骤实现 1.准备文件 1.下载小说或长篇新闻稿 2.上传到hdfs上 2.读文件创建RDD 3.分词 4.排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用
一、词频统计 A. 分步骤实现 1. 准备文件,下载小说或长篇新闻稿 2. 上传到hdfs上 3. 读文件创建RDD 4. 分词 5. 排除大小写lower(),map() 6. 标点符号re.split(pattern,str),flatMap() 识别标点符号并替换成空白值 清除空白值 7. 停用词,可网盘下载stopwords.txt
准备文件 下载小说或长篇新闻稿 http://www.kekenet.com/read/202203/653673.shtml 上传到hdfs上 读文件创建RDD 分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 过滤掉长度小于2的词filter() 统计词
一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 2.读文件创建RDD 3.分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap() 停用词,可网盘下载stopwords.txt
如果你的电脑安装 TortoiseSVN 之后没有,SVN 目录没有显示状态图标,这篇文章告诉你如何解决。 原因 有很多软件都会给 Windows 目录设置状态图标,例如一些网盘软件,当然还有 TortoiseSVN。它们是按照优先级来决定显示哪个的,如果 TortoiseSVN 被排在后面,就会导致状态图标显示不出来. 解
一、词频统计 A. 分步骤实现 准备文件 下载小说或长篇新闻稿 上传到hdfs上 2.读文件创建RDD 3.分词 排除大小写lower(),map() 标点符号re.split(pattern,str),flatMap(), 停用词,可网盘下载stopwords.txt,filter(), 长
jQuery圆形轮播图插件circleCarousel 提取码:12bb 网盘下载
MediaFire 网盘队列下载脚本 自己写了一个MediaFire网盘队列下载的Python脚本,放在Github上。 MediaFire是一个国外的网盘。通常情况下,我们可以用浏览器下载MediaFire的文件,但是不能同时下载过多文件,只能几个几个地慢慢手动下载,比较费时间,所以我设计了这样一个Python脚本,可以自动下
基于SpringBoot的个人网盘项目,响应式的界面, 可以在手机、pad、电脑端查看, 可用于学习、课程设计、毕业设计参考。 gitee地址:moti-cloud: 基于SpringBoot的个人网盘项目 使用哪些技术 前端 HTML、CSS、JavaScript、JQueryBootStrap以及多个插件 后端 SpringBoot + MyBatisEhCach
电子表格很常见,但是有独特功能的不多见。 我们平时用的最多的就数Excel和WPS了,但是有一款在大企业很流行的电子表格,居然自带网盘功能,还有很多功能也已面超越了excel。值得使用。 先说说它的网盘功能吧。 这款软件自带的网盘功能,即可以在本地电脑上使用,也可以在云服务器上使用。
标题要求:Ubuntu 16.04.1 LTS 64 位操作系统 1. 基础设置 切换为 root 账号 Ubutu 系统默认登录的用户为非 root 权限用户,为了能正常安装 nextCloud,需要切换为 root 账号。执行如下命令即可: sudo su 2. 更新及安装基础包 请依次运行如下命令,有遇到询问的Is this ok [y/d/N]的
cloudreve地址 启动cloudreve文件生成配置信息。 注册服务 位置:/usr/lib/systemd/system/cloudreve.service [Unit] Description=Cloudreve Documentation=https://docs.cloudreve.org After=network.target Wants=network.target [Service] Type=simple WorkingDirectory=/
Cloudreve 快速对接多家云存储,支持七牛、又拍云、阿里云OSS、AWS S3、Onedrive、自建远程服务器,当然,还有本地存储 可限制单文件最大大小、MIMEType、文件后缀、用户可用容量 自定义主题配色 基于Aria2的离线下载 图片、音频、视频、文本、Markdown、Ofiice文档 在线预览 移动端
魔众网盘系统提供了一套在线网盘管理系统,支持多用户、分享等功能,支持多种云存储,帮您快速搭建一套公私兼备的网盘系统 魔众网盘系统发布v1.3.0版本,新功能和Bug修复累计8项,后台菜单快捷搜索 修复已知问题。 2022年01月30日魔众网盘系统发布v1.3.0版本,增加了以下8个特性: ·[新功能