利用Python列出最頻繁的單詞和它們的出現次數

2022-09-19 14:50:05 字數 3238 閱讀 5715

1樓:匿名使用者

學會珍惜,懂得珍惜。。人生只有經歷才會懂得,只有懂得才知道珍惜。。珍惜生命中的所有能夠相遇的人與經歷,珍惜生命中遇到的每一份滋味與感受,看淡得失,善待自己。。

如何用python統計一個txt檔案中某個單詞出現的次數

2樓:用著追她

1、首先,定義一個變數,儲存要統計的英文文章。

2、接著,定義兩個陣列,儲存文章中的單詞,以及各單詞的詞頻。

3、從文章中分割出所有的單詞,儲存在陣列中。

4、然後,計算文章中單詞的總數,儲存在變數中。

5、用for迴圈,統計文章中各單詞的詞頻。

6、最後,輸出文章中各單詞的詞頻。

7、執行程式,電腦會自動統計輸入文章中各單詞的詞頻。

3樓:匿名使用者

content = {}

wth open("檔案") as fr:

for line in fr:

lines = line.strip().split(" ") #假設單詞與單詞之間,空格做為分隔符

for word in lines:

if word not in content:

content[word] = 0

content[word] += 1

for word,val in content.items():

print '%s:%d\n"%(word,val)

4樓:

"fatway" 的方法簡單-美。

還有另一中方法:引入collections的counter實現更強大的功能

import collections

import re

patt = re.compile("\w+")

counter = collections.counter(patt.findall(

open('reparser.py','rt').read()

))# top 10

for word, times in counter.most_common(10):

print word, times

# find word

counter_dict = dict(counter.most_common(0))

tobefind = 'hello'

print tobefind, counter_dict.get(tobefind, 0)

5樓:匿名使用者

import re

txt = open("123.txt", "r").read()

print len(re.findall("hello", txt))

6樓:軒轅

還有個問題123.txt檔案放在哪個資料夾裡?

用python統計句子中每個單詞出現的次數 用python輸出100內的所有素數

7樓:湖海散人

(你確定是單詞不是字母?)

1.(python可以用中文變數,看不順眼就換成英文)句子 = "this is a sentence"    #可以寫別的

字典 = {}

句子拆成的單詞列表 = 句子.split()for 單詞 in 句子拆成的單詞列表:

if 單詞 in 字典.keys():

字典[單詞] += 1

else:

字典[單詞] = 0

for 單詞,次數 in 字典.items():

print('%-20s:'%單詞,次數)2.

python3.3.2 如何統計文字檔案**現的每個單詞出現的次數,單詞之間使用空格隔開

8樓:匿名使用者

wordtext=open(r'test.txt')countdict={}

for line in wordtext:

for word in line.split():

word=word.lower()

if word in countdict:

countdict[word]+=1

else:

countdict[word]=1

for word in sorted(countdict):

print("%s:%d"%(word,countdict[word]))

統計文字檔案test.txt中單詞個數,不區分大小寫,單詞必須用空格分開,不能有其它字元

這個問題能不能換個分類,在這個分類無法使用格式**

9樓:

很簡答的東東

import re

import collections

print( collections.counter( re.findall( '\w+' ,open( 'test.txt' ).read( ) ) ) )

還是多看看資料吧,這個是官方的標準答案

python中怎樣獲取一網頁上的內容?我想通過python讀取網頁上的各個不同的單詞和分別出現的次數

10樓:手速抽風

你好首先,瀏覽器顯示給使用者的內容完全是根據html原始碼來的、所以,你想獲取的一切瀏覽器顯示的內容,都是在html檔案中存在的內容

統計頁面上的單詞,必然是要讀html原始檔的可以使用urllib2庫,以及re庫來進行匹配查詢,**如下:

import urllib2

import re

word = '你想查詢的單詞'

urlfile = urllib2.urlopen('你要開啟的**內容,記住要帶上協議字首,比如http') #以檔案的形式開啟一個網頁

html = urlfile.read() #從網頁檔案中讀htmlwordlist = re.findall(re.

compile(word), html) #正則findall 查詢所有的單詞

print len(wordlist) #個數re模組記不太清,沒試驗、試試看,不行再追問

11樓:匿名使用者

1.新讀取原始碼,

2.提取單詞(範圍a-z,a-z),

3.count 個數

c++ 使用stl 容器處理很容易. python比 c++ 高階很多,相信有這樣的分隔函式,不用一個一個字元對比分隔. ,相信更加容易

誰能給我列出組裝臺式電腦的配置和價錢的單子,求助大概一共4000左右的

推薦兩款平臺配置 amd平臺 cpu amd fx 6100 推土機 6核 3.3g盒裝 849元 主機板 華碩m5a97 am3 970主機板 600元 記憶體 金士頓 ddr3 1600 4g駭客神條 135元 硬碟 西數藍盤500g 450元 顯示卡 迪蘭恆進amd hd6870恆金1g 25...

你使用最頻繁的流行網路用語有哪些

以前上網的時候,每一段時間都會有最近一段時間流行的話語。比如說我初中的時候流行木馬,呵呵,麼麼噠等高中的時候流行薩瓦迪卡,現在大學了流行說plmm,老鐵等等。其實在現在我最頻繁的流行網路用語就是你好嗎你在嗎,還有就是你今天微笑了嗎,我覺得這幾個句子都是我平時用的比較多的,而且是比較流行的句子。撩,原...

從幾何的角度談談如何利用導數判斷函式的單調性以及如何用二階導

幾何角度?那首先畫一個平面直角座標系了,然後就是導數的定義了,簡單的說導數就是某曲線,在某一點切線的斜率。那麼有了這個條件後,我們就可以發現,當一個曲線上所有切線的斜率都大於0,那麼他必定是單調遞增的。最簡單的就是一次函式了。這樣我們就可以推出,當曲線斜率為正時,那麼函式單調遞增。負數是單調遞減。而...