Ejercicio completo

quijote

# Obtener las frecuencias de letras en castellano
# Saber sacar las frecuencias de una cadena de texto
# Coger textos grandes (un fichero) y analizarlo
# A partir de ese análisis ordenar las letras por frecuencia


# En primer lugar una función frecuenciaLetras(cadena) a la que le pasamos
# una cadena y nos devuelve un diccionario con la clave cada una de las letras
# y el valor la cantidad d veces que aparece en esa cadena
# en python tenemos la función isalpha que nos devuelve true si una cadena
# solo tiene las letras de la a a la z (para no contar espacios, signos de puntuación...)
def frecuenciaLetras(cadena):
    frecuencia = {}
    # Hago lo mismo que en el ejercicio anterior de palabras
    for letra in cadena.lower():
        # TODO: Mirar el tema acentos
        if letra.isalpha():
            if letra in frecuencia:
                frecuencia[letra] += 1
            else:
                frecuencia[letra] = 1
    return frecuencia


print(frecuenciaLetras("aaabbbccd"))  # {a:3,b:3,c:2,d:1
print(frecuenciaLetras("aaa .  bbb     c  12cd"))  # {a:3,b:3,c:2,d:1


# por otro lado vamos a crear una función frecuenciaFile(archivo) que nos lee un archivo
# de texto, pasa el contenido a la función frecuenciaLetras y nos devuelve el resultado

def frecuenciaFile(archivo):
    # Abrir un archivo en modo lectura
    archivo = open(archivo, "r", encoding="utf-8")
    # Leer el contenido del archivo

    contenido = archivo.read()
    # Cerrar el archivo
    archivo.close()
    estadistica = frecuenciaLetras(contenido)
    return estadistica


frecuencias = frecuenciaFile("diccionario.txt")
print(frecuencias)  # {a:12,b:7,c:5,j:3}


# por último vamos a tener una función ordenLetras(diccionario) a la que le pasamos
# un diccionario con la frecuencia de las letras y nos devuelve una lista de letras
# ordenadas de mayor frecuencia a menor frecuencia

def ordenLetras(diccionario):
    lista = sorted(diccionario, key=diccionario.get, reverse=True)
    return lista

def ordenLetras2(diccionario):
    lista = sorted(diccionario.values(), reverse=True)
    letras=[]
    for frec in lista:
        posicion=list(diccionario.values()).index(frec)
        letra=list(diccionario.keys())[posicion]
        letras.append(letra)
    return letras

print(ordenLetras(frecuencias))
print(ordenLetras2(frecuencias))

print(frecuencias["a"])
print(frecuencias.get("a"))


Publicado por

Juan Pablo Fuentes

Formador de programación y bases de datos

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.