Don't forget to also checkout my second blog containing articles to all other related ICT topics!!

Thursday, May 3, 2012

Finding most common words in a text


from collections import Counter
import re

text = """Opvallend is dat Apple de absolute verkopen met 8,8 procent zag 
teruglopen. De iPad wordt hierin overigens niet meegerekend. 
Het marktaandeel van Apple loopt terug van 7,8 procent in de eerste drie 
maanden van 2011 naar 7,1 procent in dezelfde periode een jaar later. 
Daarmee moet het Asus inmiddels voor zich dulden."""

#goal: find the 3 most occurring words in the text
print Counter(re.findall('\w+\s+', text)).most_common(3)

[('van ', 3), ('procent ', 3), ('Apple ', 2)]

No comments:

Post a Comment