ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

url映射 ccf (Java正则表达式解法)

2019-09-08 09:02:53  阅读:265  来源: 互联网

标签:regex articles Java url URL 斜杠 规则 匹配 ccf


问题描述

试题编号: 201803-3
试题名称: URL映射
时间限制: 1.0s
内存限制: 256.0MB
问题描述: 问题描述   URL 映射是诸如 Django、Ruby on Rails 等网页框架 (web frameworks) 的一个重要组件。对于从浏览器发来的 HTTP 请求,URL 映射模块会解析请求中的 URL 地址,并将其分派给相应的处理代码。现在,请你来实现一个简单的 URL 映射功能。
  本题中 URL 映射功能的配置由若干条 URL 映射规则组成。当一个请求到达时,URL 映射功能会将请求中的 URL 地址按照配置的先后顺序逐一与这些规则进行匹配。当遇到第一条完全匹配的规则时,匹配成功,得到匹配的规则以及匹配的参数。若不能匹配任何一条规则,则匹配失败。
  本题输入的 URL 地址是以斜杠 / 作为分隔符的路径,保证以斜杠开头。其他合法字符还包括大小写英文字母、阿拉伯数字、减号 -、下划线 _ 和小数点 .。例如,/person/123/ 是一个合法的 URL 地址,而 /person/123? 则不合法(存在不合法的字符问号 ?)。另外,英文字母区分大小写,因此 /case/ 和 /CAse/ 是不同的 URL 地址。
  对于 URL 映射规则,同样是以斜杠开始。除了可以是正常的 URL 地址外,还可以包含参数,有以下 3 种:
  字符串 <str>:用于匹配一段字符串,注意字符串里不能包含斜杠。例如,abcde0123。
  整数 <int>:用于匹配一个不带符号的整数,全部由阿拉伯数字组成。例如,01234。
  路径 <path>:用于匹配一段字符串,字符串可以包含斜杠。例如,abcd/0123/。
  以上 3 种参数都必须匹配非空的字符串。简便起见,题目规定规则中 <str> 和 <int> 前面一定是斜杠,后面要么是斜杠,要么是规则的结束(也就是该参数是规则的最后一部分)。而 <path> 的前面一定是斜杠,后面一定是规则的结束。无论是 URL 地址还是规则,都不会出现连续的斜杠。 输入格式   输入第一行是两个正整数 n 和 m,分别表示 URL 映射的规则条数和待处理的 URL 地址个数,中间用一个空格字符分隔。
  第 2 行至第 n+1 行按匹配的先后顺序描述 URL 映射规则的配置信息。第 i+1 行包含两个字符串 pi 和 ri,其中 pi 表示 URL 匹配的规则,ri 表示这条 URL 匹配的名字。两个字符串都非空,且不包含空格字符,两者中间用一个空格字符分隔。
  第 n+2 行至第 n+m+1 行描述待处理的 URL 地址。第 n+1+i 行包含一个字符串 qi,表示待处理的 URL 地址,字符串中不包含空格字符。 输出格式   输入共 m 行,第 i 行表示 qi 的匹配结果。如果匹配成功,设匹配了规则 pj ,则输出对应的 rj。同时,如果规则中有参数,则在同一行内依次输出匹配后的参数。注意整数参数输出时要把前导零去掉。相邻两项之间用一个空格字符分隔。如果匹配失败,则输出 404。 样例输入 5 4
/articles/2003/ special_case_2003
/articles/<int>/ year_archive
/articles/<int>/<int>/ month_archive
/articles/<int>/<int>/<str>/ article_detail
/static/<path> static_serve
/articles/2004/
/articles/1985/09/aloha/
/articles/hello/
/static/js/jquery.js 样例输出 year_archive 2004
article_detail 1985 9 aloha
404
static_serve js/jquery.js 样例说明   对于第 1 个地址 /articles/2004/,无法匹配第 1 条规则,可以匹配第 2 条规则,参数为 2004。
  对于第 2 个地址 /articles/1985/09/aloha/,只能匹配第 4 条规则,参数依次为 1985、9(已经去掉前导零)和 aloha。
  对于第 3 个地址 /articles/hello/,无法匹配任何一条规则。
  对于第 4 个地址 /static/js/jquery.js,可以匹配最后一条规则,参数为 js/jquery.js。 数据规模和约定   1 ≤ n ≤ 100,1 ≤ m ≤ 100。
  所有输入行的长度不超过 100 个字符(不包含换行符)。
  保证输入的规则都是合法的。

 

把字符串的前导0也去掉了,80分。。。

 1 import java.util.LinkedHashMap;
 2 import java.util.Map;
 3 import java.util.Scanner;
 4 import java.util.regex.Matcher;
 5 import java.util.regex.Pattern;
 6 
 7 
 8 public class Main {
 9 
10     public static void main(String[] args) {
11         int n, m;
12         int flag = 0;
13         Scanner sc = new Scanner(System.in);
14         n = sc.nextInt();
15         m = sc.nextInt();
16         sc.nextLine();
17         LinkedHashMap<String, String> mp = new LinkedHashMap<>();
18         for (int i = 1; i <= n; ++i) {
19             String line = sc.nextLine();
20             String[] arr = line.split(" ");
21             mp.put(arr[0], arr[1]);
22         }
23 
24         for (int i = 1; i <= m; ++i) {
25             String line = sc.nextLine();
26             for (Map.Entry<String, String> en : mp.entrySet()) {
27                 String regex = en.getKey();
28                 regex = regex.replace("<int>", "(\\d+)");
29                 regex = regex.replace("<str>", "(.+)");
30                 regex = regex.replace("<path>", "(.+)");
31                 if(line.matches(regex)) {    // 完全匹配
32                     flag = 1;
33                     Pattern p = Pattern.compile(regex);
34                     Matcher mat = p.matcher(line);
35                     while (mat.find()) {    
36                         System.out.print(en.getValue());
37                         for (int j = 1; j <= mat.groupCount(); ++j) {
38                             String str = mat.group(j);
39                     //        if(str.matches("\\d+"))
40                             str = str.replaceAll("^0+", "");    // 去掉数字前面的0 (字符串前面的0也去掉了)
41                             System.out.print(" " + str);
42                         }
43                         System.out.println();
44                     }
45                     break;
46                 }
47             }
48             if(flag == 0)
49                 System.out.println(404);
50             else
51                 flag = 0;    // 重置flag
52         }
53 
54     }
55 
56 }

 

标签:regex,articles,Java,url,URL,斜杠,规则,匹配,ccf
来源: https://www.cnblogs.com/FengZeng666/p/11484278.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有