ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

08总结

2022-06-14 19:36:04  阅读:126  来源: 互联网

标签:总结 essay el int res 08 substring import


这一周,建民哥给我们进行了抗糖测验冲刺,冲刺的内容是论文爬虫系统,

 

第一阶段是进行论文的增删改查以及爬虫爬取网页中的论文数据,经过了几天的努力终于完成了,代码截图如下:

 

 

 

 

 

论文添加:

 

 

 

论文修改:

 

 

 

论文部分查询:

 

 

 

 

 

爬虫部分代码:

 

 

package bai.utils;

 

import bai.pojo.Essay;

import org.jsoup.Jsoup;

import org.jsoup.nodes.Document;

import org.jsoup.nodes.Element;

import org.jsoup.select.Elements;

import java.io.IOException;

import java.net.URL;

import java.util.ArrayList;

import java.util.List;

 

public class pa {

    Elements elements,elements1;

    List<Essay> essays=new ArrayList<>();

    public void PaQu() throws IOException {

        System.out.println("1");

        String url="https://openaccess.thecvf.com/CVPR2020?day=2020-06-18";

        Document document = Jsoup.parse(new URL(url), 30000);

        Element element=document.getElementById("content");

        elements=element.getElementsByClass("bibref");

        elements1=element.getElementsByClass("ptitle");

        System.out.println("2");

        System.out.println(elements.text());

 

    }

    public List<Essay> dispose(){

        int a=0;

        for (Element el:elements){

            Essay essay=new Essay();

            String attr=el.text();

            String[] res=attr.split("=");

            for(int j=0;j<=5;j++){

                res[j]=res[j].trim();

            }

            int idx1=res[1].lastIndexOf("}");

            essay.setAuthor(res[1].substring(1,idx1));

            int idx2=res[2].lastIndexOf("}");

            essay.setTitle(res[2].substring(1,idx2));

            int idx3=res[3].lastIndexOf("}");

            essay.setBookTitle(res[3].substring(1,idx3));

            int idx4=res[4].lastIndexOf("}");

            essay.setDate(res[4].substring(1,idx4));

            essay.setDate(essay.getDate()+(res[5].substring(1,5)));

            essays.add(essay);

        }

        for (Element el:elements1){

            if(a<essays.size()){

                String address=el.getElementsByTag("a").attr("href");

                essays.get(a).setAddress(address);

            }

            a++;

        }

        return essays;

    }

}

标签:总结,essay,el,int,res,08,substring,import
来源: https://www.cnblogs.com/lhydbk/p/16376005.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有