14-luogu-P1308 [NOIP2011 普及组] 统计单词数-程序员宅基地

问题 [NOIP2011 普及组] 统计单词数

题目描述

一般的文本编辑器都有查找单词的功能，该功能可以快速定位特定单词在文章中的位置，有的还能统计出特定单词在文章中出现的次数。

现在，请你编程实现这一功能，具体要求是：给定一个单词，请你输出它在给定的文章中出现的次数和第一次出现的位置。注意：匹配单词时，不区分大小写，但要求完全匹配，即给定单词必须与文章中的某一独立单词在不区分大小写的情况下完全相同（参见样例 1），如果给定单词仅是文章中某一单词的一部分则不算匹配（参见样例 2）。

输入格式

共 $2$ 行。

第 $1$ 行为一个字符串，其中只含字母，表示给定单词；

第 $2$ 行为一个字符串，其中只可能包含字母和空格，表示给定的文章。

输出格式

一行，如果在文章中找到给定单词则输出两个整数，两个整数之间用一个空格隔开，分别是单词在文章中出现的次数和第一次出现的位置（即在文章中第一次出现时，单词首字母在文章中的位置，位置从 $0$ 开始）；如果单词在文章中没有出现，则直接输出一个整数 $- 1$ 。

样例 #1

样例输入 #1

To
to be or not to be is a question

样例输出 #1

2 0

样例 #2

样例输入 #2

to
Did the Ottoman Empire lose its power at that time

样例输出 #2

-1

提示

数据范围

$1\leq$ 第一行单词长度 $\leq10$ 。

$1\leq$ 文章长度 $\leq10^6$ 。

noip2011 普及组第 2 题

我的错误代码

/**
 * CodeForces->力扣+洛谷+牛客->竞赛6P <训练>
 * CodeForces，力扣，牛客，洛谷，ZZULIOJ等 <比赛>
 * 
 * 专注，行动，坚持，争分夺秒——算法竞赛金牌！！！
 * 
 * 一心一意，10000小时，每天10小时+，两年九个月
*/

// 算法竞赛入门经典系列源码解析
    // 算法竞赛入门经典第2版 P
    // 算法竞赛入门经典 习题与解答 P
    // 算法竞赛入门经典 训练指南 P
    // 算法竞赛入门经典 算法实现 P
// 程序设计竞赛训练营
    // 基础与数学概念 P
    // 算法与实践 P
// 牛客练习
// 洛谷练习 P1308 [NOIP2011 普及组] 统计单词数
// 力扣练习 
// CodeForces 

/*
    Dreams never shine!
    It's you that shine while chasing your dreams :)
    JAYO!!
*/

#include <iostream>
#include <algorithm>
#include <vector>
#include <string>

using namespace std;

void LowerCase(string & str) {
    
    for (auto it = str.begin(); it != str.end(); it++) {
    
        *it = tolower(*it);
    }
}

int main() {
    
    string word, tmp;
    vector<string> text;
    int flag = 0;
    int index, i = -1;
    char ch;
    
    cin >> word;
    LowerCase(word);

    while (cin >> tmp) {
    
        ch = getchar();
        if (ch == '\n') break;
        LowerCase(tmp);
        i++;
        if (word == tmp) {
     
            if (flag == 0) {
    
                index = i;
            }
            flag++;
        }
        text.push_back(tmp);
    }

    if (flag) {
    
        cout << flag << " ";
        int sum = 0;
        for (auto m : text) {
    
            if (index == 0) break;
            sum += m.size();
            index--;
        }
        cout << sum << endl;
    }
    else cout << -1 << endl;
    

    return 0;
}

大神代码1

#include <cstring>
#include <cctype>
#include <cstdio>

void strlower (char *a) {
    //手写函数，将大写字母转换成小写字母
    for(int i = 0; a[i]; i ++ ) {
    
        if(isupper(a[i])) a[i] = tolower(a[i]);//isupper是判断是否是大写字母的系统函数，tolower是将其转换成小写字母的函数
    }
}

int main () {
    

    char destination[1000001], *q, source[11], *p;//destintion是要找的文章，source是要找的单词，p和q都是指针类，分别代表当前搜索到什么地方了和最后一次找到单词的指针
    bool flag = false;//判断是否找到了
    int ans = 0, ans1 = -1;//个数和首次出现的位置，ans1的初值是-1是因为在没找到的时候就直接输出就行了，省事

    gets(source);
    gets(destination);//输入

    strlower(destination);//全部转换成小写字母
    strlower(source);

    int len = strlen(source);//长度，在后面防止越界和加快速度

    p = destination;//先将指针设为全部

    for(; q = strstr(p, source); ) {
    //循环，strstr是在一个字符串里面给定一个字符串，寻找有没有这个字符串，若有，返回首次出现的指针否则返回NULL（空指针）
        if( q != NULL//找到了 
        && ( q == destination || *(q - 1) == ' ') //第一个条件是防止越界，第二个是判断前一个是不是空格
        && ( *(q + len) == '\0' || *(q + len) == ' ' ) ) {
    //如果后面也是空格
            ans ++ ;//答案加一
            if(flag == false) {
    //如果是首次找到
                flag = true;
                ans1 = q - destination;//第一个位置
            }
        }
        p = q + len;//刷新指针
    }

    if(flag == true)//找到了
        printf("%d %d" , ans, ans1);//输出
    else 
        printf("%d", ans1);//输出-1

    return 0;
}

大神代码2

第二种做法有穷自动机

图灵机大概就是一个“自动机”，就是说代码分好几种状态，每种状态做不同的事。

举个简单的例子吧

输入一个字符串，输入的只有两种字符，一种是字母，一种是空格。现在求一共有几个单词。注意，有可能有多个空格连在一起，开头和结尾都有可能有空格。

那么这是一道简单的有穷自动机，运行时分两种情况：

①是空格

②是字母

（其实当前状态就是上一个字符的状态

那么在遍历数组的时候拿一个变量记录下来当前是什么状态，可以用00代表当前是空格状态，11代表是字母状态

当如果当前状态是11，而现在却遇到空格，那么就计数器加一，同时要将状态改为00，如果当前状态是00，现在的字符却是字母，就只将状态改为11
BUT!
在跳出循环的时候如果状态是11，要将计数器加一，否则如果最后是字母就会少统计一个单词！（想想为什么）

有穷自动机例题【非本篇题目代码】

输入一个字符串，输入的只有两种字符，一种是字母，一种是空格。现在求一共有几个单词。注意，有可能有多个空格连在一起，开头和结尾都有可能有空格。

#include <cstdio>

int main () {
    

    char a[1001];
    int state, ans = 0;

    gets(a);

    if(a[0] == ' ') state = 0;//设置初始值
    else state = 1;

    for(int i = 1; a[i]; i ++ ) {
    //要从一开始遍历，因为零已经遍历过了
        if(a[i] == ' ') {
    //是空格
            if(state == 1) {
    //当前状态（前一个）是字母，说明找到一个单词了
                ans ++ ;//答案加一
                state = 0;//千万别忘了改状态
            }
        }
        else {
    //是字母
            if(state == 0) {
    //当前状态（前一个）是空格
                state = 1;//将状态改为1
            }
        }
    }

    if(state == 1)//最后还要判断一下千万不要忘记
        ans ++ ;
    printf("%d", ans);

    return 0;
}

那么，这就是简单的自动机代码，现在看看本题用自动机如何做

其实一样，就是注意字母状态分时要查找单词状态和不是要查找单词状态，而且单词第nn个字母的状态就用nn来表示

以下是code：

#include <cstdio>
#include <cctype>
#include <cstring>

const int SPACE = 0;   //三种状态，这是空格状态
const int LETTER = -1; //字母状态，但这表示不是要查找的单词的字母的状态
const int WORD = 1;    //而这种状态是要查找的单词的状态
//当然了，如果状态时大于1的数，说明是要查找的单词的中间部分的状态，上文讲过了

inline void strlower(char *a)
{
     //不解释，上面的代码有了
    for (int i = 0; a[i]; i++)
    {
    
        if (isupper(a[i]))
            a[i] = tolower(a[i]);
    }
}

int main()
{
    

    char a[1000001], word[20];
    int ans = 0;
    int ans2 = -1;
    int state = 0; //表状态，假设是空格，因为空格上来就判断是不是三种状态
    int i;

    gets(word);
    gets(a);
    strlower(a);
    strlower(word);
    int len = strlen(word);

    for (i = 0; a[i]; i++)
    {
     //遍历数组
        switch (state)
        {
    
        case SPACE: //如果当前状态（上一个）是空格
            if (a[i] == word[0])
                state = WORD; //变成单词第一个字母状态
            else if (a[i] == ' ')
                state = SPACE; //其实这句话可以省略，因为反正都是空格状态，改它是一样的
            else
                state = LETTER; //剩下的肯定是其他字母状态了
            break;
        case LETTER: //是其他字母状态
            if (a[i] == ' ')
                state = SPACE; //空格状态
            break;
        default: //是要查找的单词状态
            if (state < len)
            {
     //还不是最后一个字母
                if (a[i] == ' ')
                    state = SPACE;
                else if (a[i] == word[state])
                    state++; //变成下一个字母状态
                else
                    state = LETTER; //其他字母状态
            }
            else if (state == len) //是最后一个字母
            {
    
                if (a[i] == ' ')
                {
                           //如果下一个是空格，找到了！
                    state = SPACE;      //状态不要忘记改变
                    if (ans2 == -1)     //第一次找到，记录下来位置
                        ans2 = i - len; //因为i是单词的尾，所以要减长度
                    ans++;              //个数加一
                }
                else
                    state = LETTER; //可惜，最后跟着其他字母，不是单词
            }
        }
    }

    if (state == len)
    {
    
        ans++;
        if (ans2 == -1)
            ans2 = i - 1 - len;
    }
    if (ans2 == -1)
        printf("-1");
    else
        printf("%d %d", ans, ans2);

    return 0;
}

大神方法3

非常帮的想法

    //因为连起来的不算，所以要在前后加几个空格，一定要是同样多的，同量减同量，等于同量
    a=' '+a+' ';
    b=' '+b+' ';

//我的代码比较结构化，容易理解
//在此也建议大家多用用string类，c++有关于string的特大好处，c和pascal都没有哦
//
//定义头文件
#include <iostream>
#include <string>
//命名空间
using namespace std;
int main(){
    
    //定义两个字符串
    string a;
    string b;
    //用string库，调用getline, 直接读入一整行
    getline(cin,a);
    getline(cin,b);
    //转换大小写，可以都转换为大写，或者小写
    for (int i=0;i<a.length();++i){
    
        a[i]=tolower(a[i]);
    }
    for (int i=0;i<b.length();++i){
    
        b[i]=tolower(b[i]);
    }
    //因为连起来的不算，所以要在前后加几个空格，一定要是同样多的，同量减同量，等于同量
    a=' '+a+' ';
    b=' '+b+' ';
    //先看看会不会找不到，用a.find()和string::npos
    if (b.find(a)==string::npos){
    
        cout<<-1<<endl;
    }
    //如果找得到
    else {
    
        int alpha=b.find(a);
        int beta=b.find(a),s=0;//计数器初始化为0
        while (beta!=string::npos){
    
            ++s;//计数器
            beta=b.find(a,beta+1);
        }
        cout<<s<<" "<<alpha<<endl;//输出第一个和总共有几个
    }
    //函数返回值为0，结束整个程序
    return 0;
}

大神代码n

transform 函数

template<typename _InputIterator, typename _OutputIterator, typename _UnaryOperation> _OutputIterator transform(_InputIterator __first, _InputIterator __last, _OutputIterator __result, _UnaryOperation __unary_op) {
     }
输入是区间的__first－__last的一段区间，
对这段区间的数据利用__unary_op函数进行操作，
然后将结果放入到__result中。

template<typename _InputIterator1, typename _InputIterator2, typename _OutputIterator, typename _BinaryOperation> _OutputIterator transform(_InputIterator1 __first1, _InputIterator1 __last1, _InputIterator2 __first2, _OutputIterator __result, _BinaryOperation __binary_op) {
     }
第一个输入区间依旧是__first－__last这一段，
第二个输入是__first2开始取(__last-__first)这一段长度的数据，
对这两段的数据进行__binary_op操作，
然后将结果存入到__result中。
__first是第一段区间的开始
__last是第二段区间的结束
__first2是第二段区间的开始，
在第二个区间开始处向后取__last-__first长度的数据
__result是存储结果的区间开始
__binary_op是对这段数据进行操作的函数，
相当于lambda函数。

C++string中的insert()插入函数

basic_string& insert (size_type pos, const basic_string& str);
在原串下标为pos的字符前插入字符串str

basic_string& insert (size_type pos, const basic_string& str, size_type pos1, size_type n);
str从下标为pos1开始数的n个字符插在原串下标为pos的字符前

basic_string& insert (size_type pos, size_type n, char c);
在原串下标为pos的字符前插入n个字符c


#include<iostream>
using namespace std;
int main()
{
    
    string str="hello";
    string s="Hahah";
    str.insert(1,s);//在原串下标为1的字符e前插入字符串s
    cout<<str<<endl;

    string str1="hello";
    char c='w';
    str1.insert(4,5,c);//在原串下标为4的字符o前插入5个字符c
    cout<<str1<<endl;

    string str2="hello";
    string s2="weakhaha";
    str2.insert(0,s2,1,3);//将字符串s2从下标为1的e开始数3个字符，分别是eak，插入原串的下标为0的字符h前
    cout<<str2<<endl;

    return 0;
}

#include <iostream>
#include <string>
#include <algorithm>
#include <cstdio>
using namespace std;
int main()
{
    
    string word, text;
    cin >> word;
    getchar();                                           //其实我不知道要不要吞回车
    transform(word.begin(), word.end(), word.begin(), ::tolower); //使a小写化
    getline(cin, text);
    text.insert(text.begin(), ' '); //让b前面加个空格 之后用find不怕查不到第一个
    text = text + ' ';
    word = word + ' ';
    word.insert(word.begin(), ' ');                            //查找的话以首尾加空格，否则可能查找到其他单词里的字符相同但不是个单独的单词
    transform(text.begin(), text.end(), text.begin(), ::tolower); //小写化
    if (text.find(word) == -1)
    {
    
        cout << "-1";
    }
    else
    {
    
        int sum = 0;
        int n = 0;
        while (text.find(word, n) != -1) // find找不到会返回npos也就是-1
        {
    
            sum++;
            n = text.find(word, n) + 1; //剩下都好理解
        }
        cout << sum << " ";
        cout << text.find(word);
    }
}

总结

一题多解，及时复习巩固Anki!!!

本文链接：https://blog.csdn.net/m0_73132141/article/details/128309004

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

hive使用适用场景_大数据入门：Hive应用场景-程序员宅基地

文章浏览阅读5.8k次。在大数据的发展当中，大数据技术生态的组件，也在不断地拓展开来，而其中的Hive组件，作为Hadoop的数据仓库工具，可以实现对Hadoop集群当中的大规模数据进行相应的数据处理。今天我们的大数据入门分享，就主要来讲讲，Hive应用场景。关于Hive，首先需要明确的一点就是，Hive并非数据库，Hive所提供的数据存储、查询和分析功能，本质上来说，并非传统数据库所提供的存储、查询、分析功能。Hive..._hive应用场景

zblog采集-织梦全自动采集插件-织梦免费采集插件_zblog 网页采集插件-程序员宅基地

文章浏览阅读496次。Zblog是由Zblog开发团队开发的一款小巧而强大的基于Asp和PHP平台的开源程序，但是插件市场上的Zblog采集插件，没有一款能打的，要么就是没有SEO文章内容处理，要么就是功能单一。很少有适合SEO站长的Zblog采集。人们都知道Zblog采集接口都是对Zblog采集不熟悉的人做的，很多人采取模拟登陆的方法进行发布文章，也有很多人直接操作数据库发布文章，然而这些都或多或少的产生各种问题，发布速度慢、文章内容未经严格过滤，导致安全性问题、不能发Tag、不能自动创建分类等。但是使用Zblog采._zblog 网页采集插件

Flink学习四：提交Flink运行job_flink定时运行job-程序员宅基地

文章浏览阅读2.4k次，点赞2次，收藏2次。restUI页面提交1.1 添加上传jar包1.2 提交任务job1.3 查看提交的任务2. 命令行提交./flink-1.9.3/bin/flink run -c com.qu.wc.StreamWordCount -p 2 FlinkTutorial-1.0-SNAPSHOT.jar3. 命令行查看正在运行的job./flink-1.9.3/bin/flink list4. 命令行查看所有job./flink-1.9.3/bin/flink list --all._flink定时运行job

STM32-LED闪烁项目总结_嵌入式stm32闪烁led实验总结-程序员宅基地

文章浏览阅读1k次，点赞2次，收藏6次。这个项目是基于STM32的LED闪烁项目，主要目的是让学习者熟悉STM32的基本操作和编程方法。在这个项目中，我们将使用STM32作为控制器，通过对GPIO口的控制实现LED灯的闪烁。这个STM32 LED闪烁的项目是一个非常简单的入门项目，但它可以帮助学习者熟悉STM32的编程方法和GPIO口的使用。在这个项目中，我们通过对GPIO口的控制实现了LED灯的闪烁。LED闪烁是STM32入门课程的基础操作之一，它旨在教学生如何使用STM32开发板控制LED灯的闪烁。_嵌入式stm32闪烁led实验总结

Debezium安装部署和将服务托管到systemctl-程序员宅基地

文章浏览阅读63次。本文介绍了安装和部署Debezium的详细步骤，并演示了如何将Debezium服务托管到systemctl以进行方便的管理。本文将详细介绍如何安装和部署Debezium，并将其服务托管到systemctl。解压缩后，将得到一个名为"debezium"的目录，其中包含Debezium的二进制文件和其他必要的资源。注意替换"ExecStart"中的"/path/to/debezium"为实际的Debezium目录路径。接下来，需要下载Debezium的压缩包，并将其解压到所需的目录。

Android 控制屏幕唤醒常亮或熄灭_android实现拿起手机亮屏-程序员宅基地

文章浏览阅读4.4k次。需求：在诗词曲文项目中，诗词整篇朗读的时候，文章没有读完会因为屏幕熄灭停止朗读。要求：在文章没有朗读完毕之前屏幕常亮，读完以后屏幕常亮关闭；1.权限配置：设置电源管理的权限。

随便推点

目标检测简介-程序员宅基地

文章浏览阅读2.3k次。目标检测简介、评估标准、经典算法_目标检测

记SQL server安装后无法连接127.0.0.1解决方法_sqlserver 127 0 01 无法连接-程序员宅基地

文章浏览阅读6.3k次，点赞4次，收藏9次。实训时需要安装SQL server2008 R所以我上网上找了一个.exe 的安装包链接：https://pan.baidu.com/s/1_FkhB8XJy3Js_rFADhdtmA提取码：ztki注：解压后1.04G安装时Microsoft需下载.NET，更新安装后会自动安装如下：点击第一个傻瓜式安装，唯一注意的是在修改路径的时候如下不可修改：到安装实例的时候就可以修改啦数据..._sqlserver 127 0 01 无法连接

js 获取对象的所有key值，用来遍历_js 遍历对象的key-程序员宅基地

文章浏览阅读7.4k次。1. Object.keys(item); 获取到了key之后就可以遍历的时候直接使用这个进行遍历所有的key跟valuevar infoItem={ name:'xiaowu', age:'18',}//的出来的keys就是[name,age]var keys=Object.keys(infoItem);2. 通常用于以下实力中 <div *ngFor="let item of keys"> <div>{{item}}.._js 遍历对象的key

粒子群算法（PSO）求解路径规划_粒子群算法路径规划-程序员宅基地

文章浏览阅读2.2w次，点赞51次，收藏310次。粒子群算法求解路径规划路径规划问题描述给定环境信息，如果该环境内有障碍物，寻求起始点到目标点的最短路径，并且路径不能与障碍物相交，如图 1.1.1 所示。1.2 粒子群算法求解1.2.1 求解思路粒子群优化算法（PSO），粒子群中的每一个粒子都代表一个问题的可能解，通过粒子个体的简单行为，群体内的信息交互实现问题求解的智能性。在路径规划中，我们将每一条路径规划为一个粒子，每个粒子群群有 n 个粒子，即有 n 条路径，同时，每个粒子又有 m 个染色体，即中间过渡点的_粒子群算法路径规划

量化评价：稳健的业绩评价指标_rar 海龟-程序员宅基地

文章浏览阅读353次。所谓稳健的评估指标，是指在评估的过程中数据的轻微变化并不会显著的影响一个统计指标。而不稳健的评估指标则相反，在对交易系统进行回测时，参数值的轻微变化会带来不稳健指标的大幅变化。对于不稳健的评估指标，任何对数据有影响的因素都会对测试结果产生过大的影响，这很容易导致数据过拟合。_rar 海龟

IAP在ARM Cortex-M3微控制器实现原理_value line devices connectivity line devices-程序员宅基地

文章浏览阅读607次，点赞2次，收藏7次。–基于STM32F103ZET6的UART通讯实现一、什么是IAP，为什么要IAPIAP即为In Application Programming(在应用中编程)，一般情况下，以STM32F10x系列芯片为主控制器的设备在出厂时就已经使用J-Link仿真器将应用代码烧录了，如果在设备使用过程中需要进行应用代码的更换、升级等操作的话，则可能需要将设备返回原厂并拆解出来再使用J-Link重新烧录代码，这就增加了很多不必要的麻烦。站在用户的角度来说，就是能让用户自己来更换设备里边的代码程序而厂家这边只需要提供给_value line devices connectivity line devices