Tarea 1 (Entrega: 23 de Abril de 2023)

Tipos estáticos y contratos

Ya se habrán dado cuenta que ciertos lenguajes tienen tipos estáticos (C/C++, Java, C#, Scala, etc.) y otros tienen tipos dinámicos (Python, Racket, JavaScript, etc.).

En esta tarea van a implementar un lenguaje simple con funciones de primer orden, tipos de datos básicos y pares. Primero, el lenguaje contará sólo con chequeo dinámico de tipos (parte 1), para luego agregar verificación de tipos estáticos (parte 2) y finalmente agregar contratos dinámicos para funciones (parte 3).


Consulte las normas de entrega de tareas en http://pleiad.cl/teaching/cc4101. Recuerden que tienen que seguir la metodología vista en las primeras clases y dejar sus funciones debidamente documentadas.

Deben entregar via U-cursos un archivo .zip que contenga los siguientes archivos: p1.rkt, p1-test.rkt, p2.rkt, p2-test.rkt, p3.rkt y p3-test.rkt, archivos que deberán contener las funcionalidades solicitadas en cada pregunta y los tests respectivos. Puede usar como base los archivos que se encuentra aquí.

La asignación de puntaje, de cada pregunta, sigue la siguiente estructura:
  • 0.2 para soportar la sintaxis indicada (parser bien definido y estructurado)
  • 0.3 para testing (cobertura de todos los casos relevantes)
  • Puntaje restante para las funcionalidades (p.ej. intérprete para la P1)

Parte 1. Lenguaje con funciones de primer orden (2.0 ptos.)

En esta parte, vamos a implementar un lenguaje que incluye primitivas útiles (números, booleanos, pares, y operadores simples), identificadores locales (with con una cantidad arbitraria de identificadores), y definiciones de funciones top-level de múltiples argumentos.

La gramática BNF del lenguaje se define a continuación:

<prog>   ::= {<fundef>* <expr>}
 
<fundef> ::= {define {<id> <id>*} <expr>}
 
<expr>   ::= <num>
           | <id>
           | <bool>
           | {cons <expr> <expr>}
           | {add1 <expr>}
           | {+ <expr> <expr>}
           | {< <expr> <expr>}
           | {= <expr> <expr>}
           | {! <expr> <expr>}
           | {&& <expr> <expr>}
           | {|| <expr> <expr>}
           | {fst <expr>}
           | {snd <expr>}
           | {if <expr> <expr> <expr>}
           | {with {{<id> <expr>}*} <expr>}
           | {<id> <expr>*}
 

Un programa está compuesto de 0 o más definiciones de funciones, además de una expresión final que sirve de punto de entrada (como el main en C y Java). Una definición de función incluye el nombre de la función, el nombre de los parámetros formales, y finalmente la expresión del cuerpo de la función. Las expresiones fst y snd obtienen el primer y segundo elemento de un par, respectivamente (similar a car y cdr de Racket). Las demás expresiones siguen la presentación estándar vista en clases.

Los programas que terminan reducen a valores. Estos pueden ser números, booleanos o pares de valores. Siguiendo buenas prácticas, definimos un tipo de dato inductivo Val para los valores (provisto en el código fuente de la parte 1).

Algunos ejemplos de programas válidos para este lenguaje pueden ser:

{ ;; Programa de Ejemplo 1
   {define {sum x y z} {+ x {+ y z}}}
   {define {cadr x} {fst {snd x}}}
   {with {{x 9} {y {cons 1 {cons 3 4}}}}
        {sum x {fst y} {cadr y}} }
}
{ ;; Programa de Ejemplo 2
   {with {{x 5} {y 42} {z {cons 11 -3}}}
         z}
}
{ ;; Programa de Ejemplo 3
   {define {triple x} {+ x {+ x x}}}
   {define {add2 x} {+ 2 x}}
   {add2 {triple 2}}
}
 
{ ;; Programa de Ejemplo 4
   {with {{x 3} {y {+ 1 2}}}
         {if {= x y} x y}}
}

Su función run debe ser capaz de recibir un programa en sintaxis concreta e interpretarlo para producir un valor.

  • Implemente la función parse :: s-Prog → Prog
  • Implemente la función interp :: Expr → Env → list Fundef → Val

Observaciones importantes:

  • Recuerde que la estructura del BNF dicta la estructura de las funciones que procesan los programas, definiciones, expresiones, etc.
  • Al implementar el lenguaje, asegúrese de hacerlo utilizando ambientes, y no una función de substitución.
  • La semántica debe considerar alcance léxico, no dinámico.
  • Verifique en tiempo de ejecución que los argumentos de los operadores numéricos sean numéricos. Y que los argumentos de los operadores de pares sean pares (En la parse 2 se alineará la verificación dinámica con la verificación estática).
  • Considere que la igualdad solo es válida sobre números.
  • La condición de una expresión if deben ser un booleano.
  • En caso de programas con errores dinámicos, su intérprete tiene que reportarlos explícitamente. Por ejemplo:
{+ 1 {cons 3 4}}

debe fallar en tiempo de ejecución con un error (se levantan con (error msg), tal como lo hacemos en clase con los identificadores libres)

"Runtime type error: expected Number found Pair"

Recuerde que puede verificar si un test lanza una excepción con test/exn.


Parte 2. Verificación estática de tipos (2.5 ptos.)

En esta parte vamos a extender el lenguaje de la Parte 1 con anotaciones de tipos y verificación estática de ellos. Las diferencias en la sintaxis del lenguaje respecto de la parte anterior son:

  • Las declaraciones de función incluyen anotaciones de tipos en cada uno de sus argumentos y también para el tipo de retorno.
  • Las expresiones with incluyen anotaciones de tipos en cada identificador introducido.

La nueva sintaxis es la siguiente:

;; <prog> no cambia
 
<fundef> ::= {define {<id> {arg}*} [: <type>] <expr>} 
 
<arg>    ::= {<id> : <type>}   
 
<expr>   ::= ... | {with { {<id> [: <type>] <expr>}* } <expr>}  ; los otros casos no cambian
 
<type>   ::= Num | Bool | {Pair <type> <type>}

En el BNF utilizamos [ ] para denotar que algo es opcional. Note que with no incluye anotación del tipo del cuerpo y que los tipos de los identificadores son opcionales. Igualmente, el tipo de retorno de una función es opcional, pero el de cada argumento es necesario. Para funciones recursivas, pueden asumir que el tipo de retorno tiene que ser especificado.

Los programas siguientes están bien tipados:

{ ; Programa de ejemplo 1
  {with {{x : Num 5} {y : Num 10}} 
    {+ x y}}
}
 
{ ; Programa de ejemplo 2
  {with {{x 5}}
    {with {{y : Num {+ x 1}}} 
      {+ x y}}
}
 
{ ; Programa de ejemplo 3
  {define {add-pair {p : {Pair Num Num}} {x : Num}} : {Pair Num Num} 
    {cons {+ {fst p} x} {+ {snd p} x}}}
  {add-pair {cons 1 1} 1}
}
 
{ ; Programa de ejemplo 4
  {define {id {x : Num}} x}
  {id 5}
}
 
{ ; Programa de ejemplo 5
  {define {sum {x : Num} {y : Num} {z : Num}} 
    {+ x {+ y z}}}
  {define {cadr {x : {Pair Num {Pair Num Num}}}} : Num 
    {fst {snd x}}}
  {with {{x 9} {y {cons 1 {cons 3 4}}}}
        {sum x {fst y} {cadr y}} }
}
  • Defina una función typecheck :: Prog → Type/err que toma un programa y nos retorna su tipo, o lanza un error.
  • Extienda su función run para que verifique el tipo del programa (este paso puede fallar) antes de interpretarlo.

Observaciones importantes:

  • Recuerden que la gramática BNF dicta la estructura de sus definiciones
  • La verificación de tipos de un programa consiste en verificar que todas las definiciones de función estén bien tipadas, y que la última expresión tiene un tipo (no importa cuál).
  • Para una definición de función, se valida que la expresión del cuerpo tenga el mismo tipo que el tipo de retorno declarado, suponiendo que cada argumento tiene el tipo declarado. Si el tipo de retorno no se especifica, entonces se usa el tipo del cuerpo.
  • Debe definir los tipos de los operadores primitivos de manera exacta, p.ej. < es una operación que toma dos Num y retorna Bool.
  • Considere que la igualdad (=) solo puede comparar números.
  • Para una expresión if la condición debe tener tipo Bool y ambas ramas deben tener el mismo tipo t. El tipo resultante de la expresión if es t.
  • Para with se verifica que todos los argumentos cumplan con el tipo declarado y el tipo resultante será el del cuerpo de la expresión. Si los identificadores no tienen tipo explícito, entonces se les asigna el de la expresión asociada.
  • En la aplicación de función se valida que el número de argumentos coincide, y que el tipo de los argumentos coincide con los tipos esperados de la función aplicada. El tipo resultante de una aplicación es el tipo de retorno de la función aplicada.

Para los errores:

  • Los errores de identificadores libres (o funciones no definidas). Este error debe detectarse estáticamente.
  • Los mensajes de error de tipo detectados estáticamente tienen que seguir el siguiente patrón:
"Static type error: expected T1 found T2"

donde T1 es el tipo esperado y T2 el tipo encontrado.

Algunos ejemplos (no representan todos los casos, es de su responsabilidad entregar test suites completos):

  >  (typecheck '{3})
  (numT)  
  > (typecheck '{{define {f {p : Bool}} {if p 23 42}}
                          {f {< 3 4}}})
  (numT) 
  > (typecheck '{{define {one {x : Num}} 1}
                          {one #t}})
  "Static type error: expected Num found Bool" 
  > (typecheck '{{< 10 #t}})
  "Static type error: operator < expected Num found Bool"
   > (typecheck '{{if 73 #t #t}})
  "Static type error: expected Bool found Num"
  > (typecheck '{{with {{x : Num 5} {y : Num #t} {z : Num 42}}
                            z}})
  "Static type error: expected Num found Bool"

¿Puede efectivamente convencerse de que todo programa que pasa la verificación de tipo no se cae con un error de tipo durante la ejecución?


Parte 3. Contratos en funciones de primer orden (1.5 ptos.)

Ahora vamos a añadir verificación dinámica mediante contratos a las funciones de nuestro lenguaje. El único cambio en la sintaxis del lenguaje se ve reflejado en la definición de funciones, donde ahora se puede definir además un contrato para cada argumento:

<fundef> ::= {define {<id> <arg>*} [: <type>] <expr>} ; como antes
<arg>    ::= {<id> : <type>}        ; como antes
           | {<id> : <type> @ <contract>}  ; lo único nuevo

Un contrato corresponde a un predicado, una función que recibe exactamente un argumento y retorna un booleano. Un ejemplo de programa válido puede ser:

{{define {positive {x : Num}} {< 0 x}}
 {define {sub {x : Num @ positive} {y : Num}} : Num
           {- y x}}
 {sub 5 3}}

Donde el argumento x posee como contrato la función positive, que comprueba en tiempo de ejecución que x sea mayor que 0.

  • Extienda nuevamente su función run para que verifique los contratos en tiempo de ejecución.

Observaciones importantes:

  • En el intérprete, cuando se efectúa una aplicación de función, se debe que verificar que los argumentos cumplan con los contratos declarados (en caso de que existan).
  • Cuando el contrato no se cumpla, se debe lanzar un error con el siguiente patrón:
    "Runtime contract error: <v> does not satisfy <contract>"

    donde <v> es el valor al que se le aplicó el contrato <contract> el nombre de este.

  • Una función usada como contrato debe aceptar un solo argumento de cualquier tipo válido y debe retornar un valor de tipo Bool. En caso de no cumplir esta condición se debe lanzar un error con el siguiente patrón:
    "Static contract error: invalid type for <c>"

    donde <c> es el nombre del contrato que no tipa.

Más ejemplos:

{{define {positive {x : Num}} {< 0 x}}
 {define {negate {x : Num @ positive}} {- 0 x}}
 {negate 23}}
{{define {pair-non-zero? {p : {Pair Num Num}}} {and {} {}}}
 {define {pair-div {p : {Pair Num Num} @ pair-non-zero?}} {/ {fst x} {snd x}}}
 {+ {pair-div {cons 30 5}} {pair-div {cons 60 0}}}
}
"Runtime contract error: (60,0) does not satisfy pair-non-zero?"
> (run '{{define {add {x : Num} {y : Num}} {+ x y}}
         {define {oh-no {x : Num @ add}} x}
         {oh-no 21 21}})
"Static contract error: invalid type for add"