quijote
# Obtener las frecuencias de letras en castellano
# Saber sacar las frecuencias de una cadena de texto
# Coger textos grandes (un fichero) y analizarlo
# A partir de ese análisis ordenar las letras por frecuencia
# En primer lugar una función frecuenciaLetras(cadena) a la que le pasamos
# una cadena y nos devuelve un diccionario con la clave cada una de las letras
# y el valor la cantidad d veces que aparece en esa cadena
# en python tenemos la función isalpha que nos devuelve true si una cadena
# solo tiene las letras de la a a la z (para no contar espacios, signos de puntuación...)
def frecuenciaLetras(cadena):
frecuencia = {}
# Hago lo mismo que en el ejercicio anterior de palabras
for letra in cadena.lower():
# TODO: Mirar el tema acentos
if letra.isalpha():
if letra in frecuencia:
frecuencia[letra] += 1
else:
frecuencia[letra] = 1
return frecuencia
print(frecuenciaLetras("aaabbbccd")) # {a:3,b:3,c:2,d:1
print(frecuenciaLetras("aaa . bbb c 12cd")) # {a:3,b:3,c:2,d:1
# por otro lado vamos a crear una función frecuenciaFile(archivo) que nos lee un archivo
# de texto, pasa el contenido a la función frecuenciaLetras y nos devuelve el resultado
def frecuenciaFile(archivo):
# Abrir un archivo en modo lectura
archivo = open(archivo, "r", encoding="utf-8")
# Leer el contenido del archivo
contenido = archivo.read()
# Cerrar el archivo
archivo.close()
estadistica = frecuenciaLetras(contenido)
return estadistica
frecuencias = frecuenciaFile("diccionario.txt")
print(frecuencias) # {a:12,b:7,c:5,j:3}
# por último vamos a tener una función ordenLetras(diccionario) a la que le pasamos
# un diccionario con la frecuencia de las letras y nos devuelve una lista de letras
# ordenadas de mayor frecuencia a menor frecuencia
def ordenLetras(diccionario):
lista = sorted(diccionario, key=diccionario.get, reverse=True)
return lista
def ordenLetras2(diccionario):
lista = sorted(diccionario.values(), reverse=True)
letras=[]
for frec in lista:
posicion=list(diccionario.values()).index(frec)
letra=list(diccionario.keys())[posicion]
letras.append(letra)
return letras
print(ordenLetras(frecuencias))
print(ordenLetras2(frecuencias))
print(frecuencias["a"])
print(frecuencias.get("a"))