Ya se habrán dado cuenta que ciertos lenguajes tienen tipos estáticos (C/C++, Java, C#, Scala, etc.) y otros tienen tipos dinámicos (Python, Racket, JavaScript, etc.).
En esta tarea van a implementar un lenguaje simple con funciones de primer orden, tipos de datos básicos y pares. Para implementar este lenguaje necesitaremos un parser (lo implementamos en la tarea 1a), y un intérprete, dividiremos el desarrollo de esta tarea en dos partes (más una opcional). Primero, el lenguaje contará sólo con chequeo dinámico de tipos (parte 1), para luego agregar verificación de tipos estáticos (parte 2). Opcionalmente (como bonus), puede agregar contratos dinámicos para funciones (parte 3).
Distribución de Puntaje
Esta tarea tiene 4 pts en total, que se dividen de la siguiente manera:
Deben entregar via U-cursos un archivo .zip que contenga los siguientes archivos: p1.rkt
, p1-test.rkt
, p2.rkt
, p2-test.rkt
, archivos que deberán contener las funcionalidades solicitadas en cada pregunta y los tests respectivos.
Si lo desea, puede obtener un bonus resolviendo la tercera parte, que es opcional: p3.rkt
y p3-test.rkt
. Más detalles al final del documento.
Nota: Es libre de implementar el intérprete usando sustitución inmediata o diferida (con ambientes), en cuyo caso podría serle útil el archivo env.rkt
Deben entregar vía U-Cursos un único archivo .zip que contenga todos los archivos de su entrega.
En esta parte, vamos a implementar un lenguaje que incluye primitivas útiles (números, booleanos, pares, y operadores simples), identificadores locales (with
con una cantidad arbitraria de identificadores), y definiciones de funciones top-level de múltiples argumentos.
La gramática BNF del lenguaje se define a continuación:
<prog> ::= {<fundef>* <expr>} <fundef> ::= {define {<id> <id>*} <expr>} <expr> ::= <num> | <id> | <bool> | {cons <expr> <expr>} | {add1 <expr>} | {+ <expr> <expr>} | {- <expr> <expr>} | {< <expr> <expr>} | {= <expr> <expr>} | {! <expr>} | {&& <expr> <expr>} | {|| <expr> <expr>} | {fst <expr>} | {snd <expr>} | {if <expr> <expr> <expr>} | {with {<binding>*} <expr>} | {<id> <expr>*} <binding> ::= {<id> <expr>}
Esta gramática es similar a la presentada en la tarea 1a, con las siguientes diferencias.
&&
y ||
.cons
. Las expresiones fst
y snd
permiten obtienen el primer y segundo elemento, respectivamente (similar a car
y cdr
de Racket).
Los programas que terminan reducen a valores. Estos pueden ser números, booleanos o pares de valores. Siguiendo las buenas prácticas de desarrollo del curso, se define un tipo de datos inductivo Val
para los valores del lenguaje (provisto en el código fuente de la parte 1).
Algunos ejemplos de programas válidos para el lenguaje descrito pueden ser:
{ {with {{x 3} {y {+ 1 2}}} {if {= x y} x y}} } { {with {{x 5} {y 42}} {cons x z}} } { {define {sum x y z} {+ x {+ y z}}} {define {cadr x} {fst {snd x}}} {with {{x 9} {y {cons 1 {cons 3 4}}}} {sum x {fst y} {cadr y}} } } { {define {implies p q} {|| {! p} q}} {implies #f #t} }
Observaciones importantes:
with
es la del let de Racket. En particular esto significa que un binding no puede definirse en función de los bindings anteriores del mismo with
. Por ejemplo, el siguiente programa lanza un error de identificador libre, pues x
no es “visible” desde la expresión nombrada por y
:{ {with {{x 2} {y {add1 x}}} {add1 y}} } >> Free identifier: x
En cambio, el siguiente programa si funciona, pues x
fue introducido en el with
que “engloba” al with
donde se usa x
.
{ {with {{x 2}} {with {{y {add1 x}}} {add1 y}} }
Además de lo anterior, asumiremos por simplicidad que en los bindings de un mismo with
no pueden haber repeticiones/reintroducciones de identificadores. No es necesario que verifique este punto, puede simplemente asumir que es parte del contrato. Por ejemplo, el comportamiento del siguiente programa estaría indefinido:
{ {with {{x 2} {x 4}} x} }
if
debe ser un booleano.Runtime type error: expected <type> found <value>
donde <type> ::= Number | Boolean | Pair
, y <value>
es un valor en sintaxis concreta.
Nota: En el código base se provee la función pp-val :: Val → String
, que dado un valor retorna un string con su representación en sintaxis concreta. Los errores se levantan con (error msg)
(tal como lo hacemos en clase con los identificadores libres).
A continuación se muestran algunos programas que fallan dinámicamente por errores de tipo:
{ {+ 1 {cons 3 4}} } >> Runtime type error: expected Number found {cons 3 4}
{ {&& {+ 1 2} #f} } >> Runtime type error: expected Boolean found 3
{ {snd {! #t}} } >> Runtime type error: expected Pair found #f
{ {if {cons 2 3} 1 0} } >> Runtime type error: expected Boolean found {cons 2 3}
Recuerde que puede verificar si un test lanza una excepción con test/exn
.
{ {foo 2 3} } >> Undefined function: foo { {define {bar p} {! p}} {bar #t #f} } >> Arity mismatch: function bar expected 1 arguments, received 2
Teniendo en cuenta todo lo descrito anteriormente, implemente las siguientes funciones:
interp :: Expr List[Fundef] → Val or error
, que interpreta una expresión considerando una lista de funciones definidas al top-level. Si lo desea, puede implementar interp
usando ambientes (sustitución diferida). Recuerde actualizar la firma de la función si elige dicha opción.run :: s-expr → Val or error
, que toma un programa escrito en sintaxis concreta, lo parsea e interpreta.En esta parte vamos a extender el lenguaje con anotaciones de tipos y verificación estática de ellos. Las diferencias en la sintaxis del lenguaje respecto de la parte anterior son:
with
pueden incluir anotaciones de tipos en cada identificador introducido.La nueva sintaxis concreta es la siguiente:
;; <prog> y <expr> no cambian <fundef> ::= {define {<id> <arg>*} : <type> <expr>} <arg> ::= {<id> : <type>} <binding> ::= {<id> [: <type>] <expr>} <type> ::= Num | Bool | {Pair <type> <type>}
En el BNF utilizamos [ ]
para denotar que algo es opcional. Note que with
no incluye anotación del tipo del cuerpo y que los tipos de los identificadores son opcionales.
Por otro lado, el tipo de retorno de una función siempre debe estar presente, al igual que el de cada uno de sus argumentos.
A continuación puede ver ejemplos de programas en la nueva sintaxis, los que (además) están bien tipados:
{ {with {{x : Num 5} {y : Num 10}} {+ x y}} }
{ {with {{x 5}} {with {{y : Num {+ x 1}}} {+ x y}} }
{ {define {add-pair {p : {Pair Num Num}} {x : Num}} : {Pair Num Num} {cons {+ {fst p} x} {+ {snd p} x}}} {add-pair {cons 1 1} 1} }
{ {define {id {x : Num}} : Num x} {id 5} }
{ {define {sum {x : Num} {y : Num} {z : Num}} : Num {+ x {+ y z}}} {define {cadr {x : {Pair Num {Pair Num Num}}}} : Num {fst {snd x}}} {with {{x 9} {y {cons 1 {cons 3 4}}}} {sum x {fst y} {cadr y}} } }
Note que se agregó el nodo <arg>
al BNF, el cual especifica la sintaxis concreta de un argumento de función.
Arg
que representa a un argumento de función en el AST.parse-arg
que parsea un argumento de función.parse-fundef
para que utilice parse-arg
para parsear los argumentos.
Además de lo anterior, observe que el nodo <binding>
en el BNF cambió, y ahora puede incluir una anotación opcional de tipo para el identificador que se introduce.
Binding
para que pueda almacenar el tipo del identificador.parse-binding
para que acepte una anotación opcional de tipo. Nota: Cuando no se especifica el tipo, puede guardar el valor #f
en el lugar donde se almacenaría el tipo.Para poder realizar un checkeo de tipos estático, necesitaremos:
typecheck-expr :: Exp Env List[Fundef] → Type or error
que toma una expresión, un ambiente y una lista de definiciones de funciones, y retorna el tipo de la expresión o lanza un error.typecheck-fundef :: Fundef List[Fundef] → Type or error
que recibe una definición de función y una lista de definiciones de funciones, y retorna el tipo de retorno de la función, o lanza un error.typecheck :: Prog → Type or error
que toma un programa y nos retorna su tipo, o lanza un error.run
para que verifique el tipo del programa (este paso puede fallar) antes de interpretarlo. Note que tendrá que hacer pequeñas modificaciones a la función interp
para que pueda procesar el nuevo AST con anotaciones de tipo. Unicamente los casos para el with
y aplicaciones de función se verán afectados.Observaciones importantes:
<
es una operación que toma dos Num
y retorna Bool
. =
) solo puede comparar números.if
la condición debe tener tipo Bool
y ambas ramas deben tener el mismo tipo t
. El tipo resultante de la expresión if
es t
.with
se verifica que todos los argumentos cumplan con el tipo declarado y el tipo resultante será el del cuerpo de la expresión. Si los identificadores no tienen tipo explícito, entonces se les asigna el de la expresión asociada.Para los errores:
"Static type error: expected T1 found T2"
donde T1
es el tipo esperado y T2
el tipo encontrado.
Algunos ejemplos (no representan todos los casos, es de su responsabilidad entregar test suites completos):
> (typecheck (parse-prog '{3})) (numT)
> (typecheck (parse-prog '{{define {f {p : Bool}} {if p 23 42}} {f {< 3 4}}})) (numT)
> (typecheck (parse-prog '{{define {one {x : Num}} 1} {one #t}})) "Static type error: expected Num found Bool"
> (typecheck (parse-prog '{{< 10 #t}})) "Static type error: operator < expected Num found Bool"
> (typecheck (parse-prog '{{if 73 #t #t}})) "Static type error: expected Bool found Num"
> (typecheck (parse-prog '{{with {{x : Num 5} {y : Num #t} {z : Num 42}} z}})) "Static type error: expected Num found Bool"
¿Puede efectivamente convencerse de que todo programa que pasa la verificación de tipo no se cae con un error de tipo durante la ejecución?
El propósito de esta parte es añadir verificación dinámica mediante contratos a las funciones de nuestro lenguaje. El único cambio en la sintaxis del lenguaje se ve reflejado en la definición de funciones, donde ahora se puede definir además un contrato para cada argumento:
<fundef> ::= {define {<id> <arg>*} : <type> <expr>} ; como antes <arg> ::= {<id> : <type>} ; como antes | {<id> : <type> @ <contract>} ; lo único nuevo
Un contrato corresponde a un predicado, una función que recibe exactamente un argumento y retorna un booleano. Un ejemplo de programa válido puede ser:
{{define {positive {x : Num}} : Bool {< 0 x}} {define {sub {x : Num @ positive} {y : Num}} : Num {- y x}} {sub 5 3}}
Donde el argumento x
posee como contrato la función positive
, que comprueba en tiempo de ejecución que x
sea mayor que 0.
run
para que verifique los contratos en tiempo de ejecución. Observaciones importantes:
"Runtime contract error: <v> does not satisfy <contract>"
donde <v>
es el valor al que se le aplicó el contrato <contract> el nombre de este.
Bool
. Esta verificación debe realizarse estáticamente y, en caso de no cumplir dicha condición, se debe lanzar un error con el siguiente patrón: "Static contract error: invalid type for <c>"
donde <c>
es el nombre del contrato que no tipa.
Más ejemplos:
{{define {positive {x : Num}} : Bool {< 0 x}} {define {negate {x : Num @ positive}} : Num {- 0 x}} {negate 23}}
{{define {pair-non-zero? {p : {Pair Num Num}}} : Bool {&& {= 0 {fst p}} {= 0 {snd p}}}} {define {pair-div {p : {Pair Num Num} @ pair-non-zero?}} : Num {/ {fst x} {snd x}}} {+ {pair-div {cons 30 5}} {pair-div {cons 60 0}}} } "Runtime contract error: {cons 60 0} does not satisfy pair-non-zero?"
> (run '{{define {add {x : Num} {y : Num}} : Num {+ x y}} {define {oh-no {x : Num @ add}} : Bool x} {oh-no 21 21}}) "Static contract error: invalid type for add"