正在加载图片...
(1)要求实现简单的网络文本抓取功能,输入网址后抓取网页信息并存储为 本地文本文件。 例如输入网址:http://127.0.0.1:8080/demo/testl.txt,抓取该页码的文 本信息,可存储为本地文件1.txt,按照类似的方法抓取多个页面,存储多个本 地文本文件,作为文本相似度的测试数据。 (2)设计文本相似度计算方法,采用的计算方法请查阅文献,例如可采用余 弦相似度分类算法等,从准备好的本地文本文件中选择一个作为样本与其他的文 本文件依次进行相似度计算,通过计算结果找出与样本最相似的文本。 (3)设计语言不限,可采用Java、C#、python等高级语言。 注:可以只将汉字作为向量,其他的如标点,数字等符号不处理,在本项目 中,若进行了中文分词、停用词清理等优化设计,根据测试结果可加分评为优 秀! 【实习报告写作重点】 (1)用编程实现http请求与响应,抓取网络文本。 (2)文本相似度算法设计。 (3)算法运行测试 1-2秘钥容器排序 【实习内容】 数据结构综合应用、排序算法综合应用、算法设计 【基本要求】 密钥是一种参数,它是在明文转换为密文或将密文转换为明文的算法中输入 的数据。密钥分为两种:对称密钥与非对称密钥,对称密钥加密,又称私钥加密, 即信息的发送方和接收方用一个密钥去加密和解密数据。它的最大优势是加/解 密速度快,适合于对大数据量进行加密,但密钥管理困难。密钥容器(Ky Container)是一个密钥数据库的一部分,其包含了属于一个特定用户的所有的 密钥对(交换和签名密钥对)。为了信息的安全,Kymi教授决定对服务器秘钥 容器里的秘钥进行分析筛选,每1个秘钥都是一个字符串,可以包括大小写字母,(1)要求实现简单的网络文本抓取功能,输入网址后抓取网页信息并存储为 本地文本文件。 例如输入网址:http://127.0.0.1:8080/demo/test1.txt,抓取该页码的文 本信息,可存储为本地文件 1.txt,按照类似的方法抓取多个页面,存储多个本 地文本文件,作为文本相似度的测试数据。 (2)设计文本相似度计算方法,采用的计算方法请查阅文献,例如可采用余 弦相似度分类算法等,从准备好的本地文本文件中选择一个作为样本与其他的文 本文件依次进行相似度计算,通过计算结果找出与样本最相似的文本。 (3)设计语言不限,可采用 Java、C#、python 等高级语言。 注:可以只将汉字作为向量,其他的如标点,数字等符号不处理,在本项目 中,若进行了中文分词、停用词清理等优化设计,根据测试结果可加分评为优 秀! 【实习报告写作重点】 (1)用编程实现 http 请求与响应,抓取网络文本。 (2)文本相似度算法设计。 (3)算法运行测试 1-2 秘钥容器排序 【实习内容】 数据结构综合应用、排序算法综合应用、算法设计 【基本要求】 密钥是一种参数,它是在明文转换为密文或将密文转换为明文的算法中输入 的数据。密钥分为两种:对称密钥与非对称密钥,对称密钥加密,又称私钥加密, 即信息的发送方和接收方用一个密钥去加密和解密数据。它的最大优势是加/解 密速度快,适合于对大数据量进行加密,但密钥管理困难。密钥容器(Key Container)是一个密钥数据库的一部分,其包含了属于一个特定用户的所有的 密钥对(交换和签名密钥对)。 为了信息的安全,Kymi 教授决定对服务器秘钥 容器里的秘钥进行分析筛选,每 1 个秘钥都是一个字符串,可以包括大小写字母
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有