免費注冊 查看新帖 |

Chinaunix

  平臺 論壇 博客 文庫
12下一頁
最近訪問板塊 發新帖
查看: 19573 | 回復: 14
打印 上一主題 下一主題

需要把這些關鍵字行取出來 [復制鏈接]

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
跳轉到指定樓層
1 [收藏(0)] [報告]
發表于 2017-06-29 14:07 |只看該作者 |倒序瀏覽
本帖最后由 Windows19 于 2017-06-29 14:23 編輯

100g  log  效率  性能

a.txt
4gfgdg\[8654
45345btgtfdfddgggd
/[][ry4353453466434534rtyt/yr'
234235346465'/\.h\'rt;'uy6r\'y7;
gfgdg9687110575448
btgtfdfddgggd\';btgtfdfddgggd
4353453466434534.,/'4353453466434534/'ryrtytryrtlyphft''/
btgtfdfddgggd\';btgtfdfddgggd8654

'\kji']\;\lknokjp8
8u90ulknouh07kno078onk
/[][ry4353453466434534789rtyt/yr'
4gfgdgab\[8654243
我已經有1個B文本  需要把這些有關鍵字行取出來  而b文件大小僅5m左右  沒有關鍵字的可以不輸出

精確匹配b文本中關鍵字  數字串   子母串   后輸出  區分大小寫

b.txt
gfgdg
btgtfdfddgggd
4353453466434534
234235346465
8654
9687110575448
6789679869797897897879
uuighkhgihugouhjoihiohijoiioio

示例中顏色匹配關鍵子
大概應得結果,  log.txt

4gfgdg\[8654
45345btgtfdfddgggd
/[][ry4353453466434534rtyt/yr'
234235346465'/\.h\'rt;'uy6r\'y7;
gfgdg9687110575448
btgtfdfddgggd\';btgtfdfddgggd
4353453466434534.,/'4353453466434534/'ryrtytryrtlyphft''/
btgtfdfddgggd\';btgtfdfddgggd8654

謝謝了,,,







論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
2 [報告]
發表于 2017-06-29 23:58 來自手機 |只看該作者
高手在那?

論壇徽章:
0
3 [報告]
發表于 2017-06-30 09:52 |只看該作者
讀A文件,然后一行一行去查,不行嗎

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
4 [報告]
發表于 2017-06-30 10:41 來自手機 |只看該作者
quanpai 發表于 2017-06-30 09:52
讀A文件,然后一行一行去查,不行嗎

也許按老師你思路可以吧,不妨試試

論壇徽章:
6
丑牛
日期:2014-03-21 15:42:04子鼠
日期:2014-04-12 11:50:17處女座
日期:2014-09-01 09:25:1115-16賽季CBA聯賽之吉林
日期:2015-12-22 14:01:5215-16賽季CBA聯賽之廣東
日期:2016-03-08 18:49:422016科比退役紀念章
日期:2016-07-06 12:19:55
5 [報告]
發表于 2017-06-30 21:25 |只看該作者
egrep -f b.txt a.txt

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
6 [報告]
發表于 2017-06-30 22:06 來自手機 |只看該作者
本帖最后由 Windows19 于 2017-07-01 05:42 編輯
stanley_tam 發表于 2017-06-30 21:25
egrep -f b.txt a.txt

         
,,

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
7 [報告]
發表于 2017-06-30 22:08 來自手機 |只看該作者

沒看到精確匹配?

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
8 [報告]
發表于 2017-07-01 15:01 來自手機 |只看該作者
想不到要實現起來這么難

論壇徽章:
7
戌狗
日期:2013-12-15 20:43:38技術圖書徽章
日期:2014-03-05 01:33:12技術圖書徽章
日期:2014-03-15 20:31:17未羊
日期:2014-03-25 23:48:20丑牛
日期:2014-04-07 22:37:44巳蛇
日期:2014-04-11 21:58:0915-16賽季CBA聯賽之青島
日期:2016-03-17 20:36:13
9 [報告]
發表于 2017-07-03 01:55 |只看該作者
本帖最后由 rubyish 于 2017-07-02 21:57 編輯

if linux? shishi biru.c


compile:
gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`

run:
./biru b  a  >  c


LINE: max line length
KEY: max key length
  1. # define LINE     512
  2. # define KEY      256
復制代碼


biru.c

  1. // gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`
  2. // ./biru b a > c

  3. # include <stdio.h>
  4. # include <ctype.h>
  5. # include <string.h>
  6. # include <stdlib.h>
  7. # include <glib.h>

  8. # define LINE     512
  9. # define KEY      256

  10. # define insert   g_hash_table_insert
  11. # define contains g_hash_table_contains
  12. # define Table    g_hash_table_new_full
  13. # define destroy  g_hash_table_destroy
  14. # define STR      g_str_hash, g_str_equal
  15. # define FREE     F_, F_
  16. # define print(s) fputs (s, stdout)

  17. typedef char *str;
  18. typedef char kar;
  19. typedef unsigned Int;

  20. void alkaa (str);
  21. void fari (str);
  22. GHashTable *hash = NULL;

  23. int main (int para, str *vec){
  24.     fari (vec[1]);
  25.     alkaa (vec[2]);
  26.     destroy (hash);
  27.     return 0;
  28. } /* main */

  29. /* ______________________ SUB ______________________ */

  30. void F_ (gpointer data) {
  31.     free (data);
  32. }

  33. void fari (str fil){
  34.     FILE *lima = fopen (fil, "r");

  35.     hash = Table (STR, FREE);
  36.     kar garis[LINE] = { 0 };

  37.     while (fgets (garis, LINE, lima)) {
  38.         garis[strlen (garis) - 1] = 0;
  39.         insert (hash, strdup (garis), NULL);
  40.     }
  41. }


  42. void alkaa (str fil){
  43.     FILE *lima      = fopen (fil, "r");
  44.     kar garis[LINE] = { 0 };
  45.     kar kunci[KEY]  = { 0 };

  46.     while (fgets (garis, LINE, lima)) {
  47.         kar *dat   = garis;
  48.         Int aantal = 0;

  49.         while (*dat) {
  50.             if (!isalnum (*dat)) {
  51.                 dat++;
  52.                 continue;
  53.             }

  54.             str formaat = isdigit (*dat) ? "%[0-9]%n" : "%[a-zA-Z]%n";
  55.             sscanf (dat, formaat, kunci, &aantal);
  56.             
  57.             if (contains (hash, kunci)) {
  58.                 print (garis);
  59.                 break;
  60.             }
  61.             
  62.             dat += aantal;
  63.         }
  64.     }
  65. } /* dos */

復制代碼

評分

參與人數 1信譽積分 +10 收起 理由
Windows19 + 10 謝謝 裝好環境再來試

查看全部評分

論壇徽章:
22
2015年亞洲杯之科威特
日期:2015-04-18 15:27:07每日論壇發貼之星
日期:2016-01-27 06:20:0015-16賽季CBA聯賽之廣夏
日期:2016-03-28 16:20:51程序設計版塊每日發帖之星
日期:2016-04-09 06:20:00CU十四周年紀念徽章
日期:2016-05-03 09:35:1415-16賽季CBA聯賽之天津
日期:2016-11-18 08:31:3115-16賽季CBA聯賽之山西
日期:2016-12-07 16:29:5315-16賽季CBA聯賽之八一
日期:2017-01-10 11:34:3415-16賽季CBA聯賽之吉林
日期:2017-03-30 22:51:1915-16賽季CBA聯賽之廣夏
日期:2017-04-13 20:51:52程序設計版塊每日發帖之星
日期:2016-01-27 06:20:00每日論壇發貼之星
日期:2015-12-28 06:20:00
10 [報告]
發表于 2017-07-03 07:54 |只看該作者
回復 9# rubyish
我將你的代碼放入腳本后執行后
返回信息了
  1. // gcc -Wall -O3 -march=native -o biru biru.c `pkg-config --cflags --libs glib-2.0`
  2. // ./biru b a > c

  3. # include <stdio.h>
  4. # include <ctype.h>
  5. # include <string.h>
  6. # include <stdlib.h>
  7. # include <glib.h>

  8. # define LINE     512
  9. # define KEY      256

  10. # define insert   g_hash_table_insert
  11. # define contains g_hash_table_contains
  12. # define Table    g_hash_table_new_full
  13. # define destroy  g_hash_table_destroy
  14. # define STR      g_str_hash, g_str_equal
  15. # define FREE     F_, F_
  16. # define print(s) fputs (s, stdout)

  17. typedef char *str;
  18. typedef char kar;
  19. typedef unsigned Int;

  20. void alkaa (str);
  21. void fari (str);
  22. GHashTable *hash = NULL;

  23. int main (int para, str *vec){
  24.     fari (vec[1]);
  25.     alkaa (vec[2]);
  26.     destroy (hash);
  27.     return 0;
  28. } /* main */

  29. /* ______________________ SUB ______________________ */

  30. void F_ (gpointer data) {
  31.     free (data);
  32. }

  33. void fari (str fil){
  34.     FILE *lima = fopen (fil, "r");

  35.     hash = Table (STR, FREE);
  36.     kar garis[LINE] = { 0 };

  37.     while (fgets (garis, LINE, lima)) {
  38.         garis[strlen (garis) - 1] = 0;
  39.         insert (hash, strdup (garis), NULL);
  40.     }
  41. }


  42. void alkaa (str fil){
  43.     FILE *lima      = fopen (fil, "r");
  44.     kar garis[LINE] = { 0 };
  45.     kar kunci[KEY]  = { 0 };

  46.     while (fgets (garis, LINE, lima)) {
  47.         kar *dat   = garis;
  48.         Int aantal = 0;

  49.         while (*dat) {
  50.             if (!isalnum (*dat)) {
  51.                 dat++;
  52.                 continue;
  53.             }

  54.             str formaat = isdigit (*dat) ? "%[0-9]%n" : "%[a-zA-Z]%n";
  55.             sscanf (dat, formaat, kunci, &aantal);
  56.             
  57.             if (contains (hash, kunci)) {
  58.                 print (garis);
  59.                 break;
  60.             }
  61.             
  62.             dat += aantal;
  63.         }
  64.     }
  65. } /* dos */

復制代碼

$ ./biru b.txt  a.txt  >  c
./biru: line 1: pkg-config: command not found
./biru: line 1: //: Is a directory
./biru: line 2: //: Is a directory
./biru: line 21: typedef: command not found
./biru: line 22: typedef: command not found
./biru: line 23: typedef: command not found
./biru: line 25: syntax error near unexpected token `('
./biru: line 25: `void alkaa (str);'




您需要登錄后才可以回帖 登錄 | 注冊

本版積分規則 發表回復

  

北京盛拓優訊信息技術有限公司. 版權所有 京ICP備16024965號-6 北京市公安局海淀分局網監中心備案編號:11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報專區
中國互聯網協會會員  聯系我們:huangweiwei@itpub.net
感謝所有關心和支持過ChinaUnix的朋友們 轉載本站內容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP
   日韩综合区视频第一页导航,无码JK粉嫩小泬在线观看,午夜精品A片一区二区三区,日日躁夜夜躁狠狠躁麻豆,大胆国模,免费观看无遮挡www的网站