正在加载图片...
示例 输入 输出: (11,LL)(7,LLL)(8,R) 54811134721 (5,)(4,L)(13,RL)(2,LLR)(1RRR)(4,RR)O not complete (3,L)(4R)O 试题5在海量的信息面前我们已经离不开搜索引擎。最近你发现某著名搜索引擎 Bangle的搜索结果 不尽人意,比如你按关键词搜索“ crazy stone”本意是想搜索一个名为《 crazy stone》的电影,结果 Bangle 的10万条返回信息大部分是你不需要的。 Bangle倾向于把所有包含“ crazy”和“ stone”两个关键的 网页都返回给你,而不管这两个关键词在上下文中的距离有多远。比如某网页的第一段出现了100个 “ crazy”,在间隔了5600个词后又出现了100个“sone”,结果这个网页被 Bangle放在搜索结果列表 的第10位,而它对你来说其实没用。因此,你希望改进现有的搜索引擎,使用户能更明确地控制搜索。 你的设想是:在关键词的前面添加一个距离阈值,限定关键词之间的最大允许距离。比如“0 crazy stone”表示“cray”和“ stone”两个关键词在文中必须是相邻出现的,“2 crazy stone”表示这两个关键 词在文中出现的间隔不能大于2个词。标点和空格不算入间隔,关键词的出现次序也不做限制。我们 称这种距离阈值加若干关键词的组合为“搜索元语”。对于搜索元语“2 crazy stone”而言“ The director of Crazy Stone is very young….”和“ Why to say the stone is crazy.”两段短文都是合格的。采用这种方 法,用户就能更好地控制搜索精度,减少垃圾结果。 你的任务就是编程实现上述想法。根据搜索元语判断短文是否满足要求。如果搜索元语中关键词 的个数大于2,则只需其中任意两个关键词在文中的出现距离不大于距离阈值,就认为该短文是满足 搜索要求的。关键词的出现次序不做限定 输入:输入文件中包含不多于50条搜索元语和不多于250段短文。 每条搜索元语占据一行,以“P”开头,后面依次跟一个非负整数代表距离阈值和若干小写 的字符串代表关键词,并有空格分隔。 2每段短文都以“T”开头,以“”结尾。“”只会出现在短文的末尾。每段短文的长度都不 大于255个字符,可能占据多行。每行最多80个字符,短文的每个后续行开头都至少有一个 空格。 3在读取短文时请忽略所有非字母字符,比如原始短文“ Dont rock- the boat as Metaphor in 1984”应该被读取为“ Dont Rock the Boat as Metaphor in”,“HP2l00X”应该被读取为“HPX”。 文件的结尾行包含单独的字符“#”。 输出:输出文件中的每一行对应输入文件中的一条搜索元语。每行以对应搜索元语的序号开始(搜索 元语的序号是指搜索元语在输入文件中出现的次序,从1开始编号),后面紧跟一个冒号及空格,然后 是以升序排列的符合该搜索元语要求的短文序号,短文的序号是指短文在输入文件中出现的次序,从 1开始编号。短文的序号之间以逗号分隔,不含空格。 示例 输 输出: 1:1,2 P: 3 concepts conceptions示例 输入: (11,LL) (7,LLL) (8,R) (5,) (4,L) (13,RL) (2,LLR) (1,RRR) (4,RR) () (3,L) (4,R) () 输出: 5 4 8 11 13 4 7 2 1 not complete 试题 5 在海量的信息面前我们已经离不开搜索引擎。最近你发现某著名搜索引擎 Baigle 的搜索结果 不尽人意,比如你按关键词搜索“crazy stone”本意是想搜索一个名为《crazy stone》的电影,结果 Baigle 的 10 万条返回信息大部分是你不需要的。Baigle 倾向于把所有包含“crazy”和“stone”两个关键的 网页都返回给你,而不管这两个关键词在上下文中的距离有多远。比如某网页的第一段出现了 100 个 “crazy”,在间隔了 5600 个词后又出现了 100 个“stone”,结果这个网页被 Baigle 放在搜索结果列表 的第 10 位,而它对你来说其实没用。因此,你希望改进现有的搜索引擎,使用户能更明确地控制搜索。 你的设想是:在关键词的前面添加一个距离阈值,限定关键词之间的最大允许距离。比如“0 crazy stone”表示“crazy”和“stone”两个关键词在文中必须是相邻出现的,“2 crazy stone”表示这两个关键 词在文中出现的间隔不能大于 2 个词。标点和空格不算入间隔,关键词的出现次序也不做限制。我们 称这种距离阈值加若干关键词的组合为“搜索元语”。对于搜索元语“2 crazy stone”而言“The director of Crazy Stone is very young....”和“Why to say the stone is crazy...”两段短文都是合格的。采用这种方 法,用户就能更好地控制搜索精度,减少垃圾结果。 你的任务就是编程实现上述想法。根据搜索元语判断短文是否满足要求。如果搜索元语中关键词 的个数大于 2,则只需其中任意两个关键词在文中的出现距离不大于距离阈值,就认为该短文是满足 搜索要求的。关键词的出现次序不做限定。 输入:输入文件中包含不多于 50 条搜索元语和不多于 250 段短文。 1 每条搜索元语占据一行,以“P:”开头,后面依次跟一个非负整数代表距离阈值和若干小写 的字符串代表关键词,并有空格分隔。 2 每段短文都以“T:”开头,以“|”结尾。“|”只会出现在短文的末尾。每段短文的长度都不 大于 255 个字符,可能占据多行。每行最多 80 个字符,短文的每个后续行开头都至少有一个 空格。 3 在读取短文时请忽略所有非字母字符,比如原始短文“Don't Rock -- the Boat as Metaphor in 1984”应该被读取为“Dont Rock the Boat as Metaphor in”,“HP2100X”应该被读取为“HPX”。 文件的结尾行包含单独的字符“#”。 输出:输出文件中的每一行对应输入文件中的一条搜索元语。每行以对应搜索元语的序号开始(搜索 元语的序号是指搜索元语在输入文件中出现的次序,从 1 开始编号),后面紧跟一个冒号及空格,然后 是以升序排列的符合该搜索元语要求的短文序号,短文的序号是指短文在输入文件中出现的次序,从 1 开始编号。短文的序号之间以逗号分隔,不含空格。 示例 输入: P: 0 rock art P: 3 concepts conceptions 输出: 1: 1,2 2:
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有