texto = 'Esta es la primer línea,\nesta es la segunda\ny esta es la tercera.'
lista_texto = texto.split(' ')
print(lista_texto)
['Esta', 'es', 'la', 'primer', '', '', 'línea,\nesta', 'es', 'la', 'segunda\ny', 'esta', 'es', 'la', 'tercera.']
El problema con la ,
nueva_lista_texto = []
for palabra in lista_texto:
nueva_palabra = palabra.replace(',','')
nueva_palabra = nueva_palabra.replace('\n','')
nueva_lista_texto.append(nueva_palabra)
print(nueva_lista_texto)
['Esta', 'es', 'la', 'primer', '', '', 'líneaesta', 'es', 'la', 'segunday', 'esta', 'es', 'la', 'tercera.']
Lista de listas
lista_texto = texto.split('\n')
print(lista_texto)
nueva_lista_texto = []
for linea in lista_texto:
nueva_linea = linea.replace(',','')
palabras = nueva_linea.split(' ')
nueva_lista_texto.append(palabras)
print(nueva_lista_texto)
['Esta es la primer línea,', 'esta es la segunda', 'y esta es la tercera.']
[['Esta', 'es', 'la', 'primer', '', '', 'línea'], ['esta', 'es', 'la', 'segunda'], ['y', 'esta', 'es', 'la', 'tercera.']]
Usando extend
lista_texto = texto.split('\n')
print(lista_texto)
nueva_lista_texto = []
for linea in lista_texto:
nueva_linea = linea.replace(',','').replace('.','')
palabras = nueva_linea.split(' ')
nueva_lista_texto.extend(palabras)
print(nueva_lista_texto)
['Esta es la primer línea,', 'esta es la segunda', 'y esta es la tercera.']
['Esta', 'es', 'la', 'primer', '', '', 'línea', 'esta', 'es', 'la', 'segunda', 'y', 'esta', 'es', 'la', 'tercera']
Unique
lista_unica = list(set(nueva_lista_texto))
print(lista_unica)
lista_unica.remove('')
print(lista_unica)
['la', '', 'es', 'tercera', 'primer', 'esta', 'línea', 'Esta', 'segunda', 'y']
['la', 'es', 'tercera', 'primer', 'esta', 'línea', 'Esta', 'segunda', 'y']
Contando cuántas veces aparece una palabra en la lista
for palabra in lista_unica:
count = nueva_lista_texto.count(palabra)
print(palabra, 'aparece ',count, 'veces en el texto')
la aparece 3 veces en el texto
es aparece 3 veces en el texto
tercera aparece 1 veces en el texto
primer aparece 1 veces en el texto
esta aparece 2 veces en el texto
línea aparece 1 veces en el texto
Esta aparece 1 veces en el texto
segunda aparece 1 veces en el texto
y aparece 1 veces en el texto
dicc = {} # un diccionario
for palabra in lista_unica:
count = nueva_lista_texto.count(palabra)
dicc.update({palabra:count})
print(palabra, 'aparece ',count, 'veces en el texto')
la aparece 3 veces en el texto
es aparece 3 veces en el texto
tercera aparece 1 veces en el texto
primer aparece 1 veces en el texto
esta aparece 2 veces en el texto
línea aparece 1 veces en el texto
Esta aparece 1 veces en el texto
segunda aparece 1 veces en el texto
y aparece 1 veces en el texto
print(dicc)
{'la': 3, 'es': 3, 'tercera': 1, 'primer': 1, 'esta': 2, 'línea': 1, 'Esta': 1, 'segunda': 1, 'y': 1}