Tarea 3
Esta tarea se distribuye con tres ficheros start.rkt, machine.rkt y tests.rkt (mediante U-Cursos). Considere las definiciones del archivo start.rkt y escriba sus funciones en él. Escriba sus tests en el archivo test.rkt adjunto. Ambos ficheros deben ser entregados vía U-Cursos. Los tests forman parte de su evaluación! Consulte las normas de entrega de tareas en http://pleiad.cl/teaching/cc4101.
(1.0) Funciones de primera clase con tipos declarados
En esta tarea haremos extensión a un lenguaje con funciones de primera clase con tipos. La gramática del lenguaje es la mostrada a continuación:
<expr> ::= <num> | <bool> | <id> | {+ <expr> <expr>} | {- <expr> <expr>} | {= <expr> <expr>} | {< <expr> <expr>} | {and <expr> <expr>} | {or <expr> <expr>} | {not <expr>} | {if <expr> <expr> <expr>} | {with : <TYPE> {<id> : <TYPE> <expr>} <expr>} | {fun {<id> : <TYPE>} : <TYPE> <expr>} | {<expr> <expr>} <TYPE> ::= Num | Bool | {<TYPE> -> <TYPE>}
- (0.4) Defina la función
(parse-t s-expr)
que parsea solo la gramática de tipos que se inicia del no terminal <TYPE>.> (parse-t '{{Num -> Num} -> Bool}) (TFun (TFun (TNum) (TNum)) (TBool))
- (0.6) Modifique1) la función
(parse expr)
para que acepte la gramática con números, booleans y funciones de primera clase con tipos. Utilice la función(parse-t s-expr)
en los puntos donde deba identificar tipos. La funciónparse
debe reemplazar elwith
por una aplicación de función como se ha visto en clases> (parse '{fun {x : Num} : Bool #f}) (fun 'x (TNum) (bool #f) (TBool)) > (parse '{with : Num {y : Num 2} {+ x y}}) (app (fun 'y (TNum) (add (id 'x) (id 'y)) (TNum)) (num 2))
(2.0) Compilación
Ahora vamos a compilar nuestro lenguaje a una máquina abstracta basada en stack. La máquina es similar a la conocida SECD2), la cual no trabaja con identificadores, sino que solo con índices. La máquina SECD consume una lista de instrucciones, utiliza una stack para almacenar datos temporales y posee un ambiente que, a diferencia del ambiente visto normalmente en el curso, es un arreglo con valores sin identificadores. Considere usar la definición de la máquina SECD del archivo machine.rkt
La función (machine ins-list)
le permitirá ejecutar una lista de instrucciones en la máquina.
> (machine (list (INT_CONST 6) (INT_CONST 1) (INT_CONST 2) (ADD) (SUB))) -3
Tome un tiempo para experimentar con la función machine
y el set de instrucciones antes de realizar los próximos ejercicios.
Índices De Bruijn
Una forma de eliminar nombres de variables o identificadores de una expresión, es usando índices De Bruijn. Anteriormente vimos que la máquina SECD trabaja solo con índices, por lo que en esta sección vamos a hacer el paso de identificadores a dichos números, usando indices De Bruijn3).
- (1.0) Implemente la función
deBruijn
que toma una expresión y la recorre reemplazando los identificadores no libres, con los índices De Bruijn (nodos(acc n)
) manteniendo el scope léxico. La salida de esta función no debería tener nodos del tipofun
niid
. En su lugar debería contener nodos del tipofun-db
yacc
. El resto de los nodos no varía.> (deBruijn (parse '{+ 1 {with : Num {x : Num 1} {with : Num {y : Num 2} {+ x y}}}})) (add (num 1) (app (fun-db (app (fun-db (add (acc 1) (acc 0)) (TFun (TNum) (TNum))) (num 2)) (TFun (TNum) (TNum))) (num 1))) > (deBruijn (add (num 1) (id 'x))) ;Arroja error "unbound identifier"
De AST a código de máquina
Vamos abordar la compilación del AST de una expresión al set de instrucciones de la SECD. A continuación se presenta el esquema de compilación que permite hacer el paso del lenguaje original a listas de instrucciones. Note que solo es el paso a notación polaca inversa:
C(n) -> INT_CONST n C(b) -> BOOL_CONST b C(n) -> ACCESS n C({+ a1 a2}) = C(a2);C(a1);ADD C({- a1 a2}) = C(a2);C(a1);SUB C({< a1 a2}) = C(a2);C(a1);LESS C({= a1 a2}) = C(a2);C(a1);EQ C({and a1 a2}) = C(a2);C(a1);AND C({or a1 a2}) = C(a2);C(a1);OR C({not a1}) = C(a1);NOT C({f a}) = C(a); C(f); APPLY C({if c tb fb}) = C(c); IF(C(tb),C(fb))
La compilación de una función puede ser inferida del ejemplo a continuación:
> (compile (deBruijn (parse '{{fun {x : Num} : Bool {< x 10}} {+ 2 3}}))) (list (INT_CONST 3) (INT_CONST 2) (ADD) (CLOSURE (list (INT_CONST 10) (ACCESS 0) (LESS) (RETURN)) (MTFun (MTNum) (MTBool))) (APPLY))
En el ejemplo anterior se puede notar que los tipos que entiende la máquina no se crean con los constructores de Type
. Los tipos en la máquina esta definidos con el deftype MType
por lo que debe hacerse una transformación de los tipos de Type
a MType
. Las reglas para la transformación son:
TNum
aMTum
TBool
aMTBool
TFun
aMTFun
aplicando la transformación recursivamente al tipo del argumento y al tipo de retorno
- (1.0) Implemente la función
(compile expr)
que dado una expresión con índices De Bruijn genera la lista de instrucciones siguiendo el esquema de compilación descrito anteriormente
(0.5) Sistemas de Tipos Simple
En la tarea anterior se abordó el chequeo de tipos en el lenguaje de predicados. En esta ocasión extenderemos el chequeo de tipos de una expresión en presencia de funciones de primera clase.
- Extienda4) la función
(typeof expr)
que recibe un nodo del AST y retorna el tipo correspondiente a la expresión o falla con TYPE_ERROR en caso de que la expresión no sea valida por validación de tipos considerando lo siguiente:- Para una función se válida que la expresión del cuerpo tenga el mismo tipo declarado en el retorno de la función. En caso de pasar la validación el tipo resultante es
(TFun targ tbody)
, dondetarg
es el tipo del argumento ytbody
es el tipo de retorno de la función. - Para la aplicación de función se valida que el primer argumento es efectivamente una función y que el tipo del segundo argumento de la aplicación (argumento real) coincide con el tipo del argumento (formal) de la función. En dicho caso la aplicación tiene el tipo del retorno de la función.
> (typeof (parse '{fun {f : Num} : Bool #t})) (TFun (TNum) (TBool)) > (typeof (parse '{{fun {f : Num} : Bool #t} #t})) ;Arroja error "TYPE_ERROR"
(1.5) Sistema de tipos con relación de subtipos
Vamos a introducir el tipo Any a nuestro lenguaje. Esto significa que vamos a comenzar a considerar relaciones de subtipo. En la literatura relacionada, la relación de subtipos se escribe A <: B
y se lee como A es subtipo de B.
Tipos Simples
Considere para esta pregunta las relaciones Num <: Any
y Bool <: Any
y que para todo tipo A se tiene A
<: A.
Implemente la función (typeof-with-sub expr)
que recibe un nodo del AST y retorna el tipo correspondiente a el o falla con TYPE_ERROR
en caso de que la expresión no sea válida. Considere que (typeof-with-sub expr)
se comporta igual que la función (typeof expr)
de la pregunta anterior, salvo por:
- La existencia de
Any
permite tipear{if #t 1 #f}
como del tipoTAny
5). Es decir que frente a tipos distintos en las ramas el resultado esTAny
. - En la definición de función, el cuerpo puede ser subtipo del tipo declarado de salida de la función
- En la aplicación de función, el tipo del argumento puede ser subtipo del tipo declarado del argumento de la función.
Subtipos de funciones
En esta sección considere que A -> B <: Any
. La noción de subtipos de funciones es muy simple y nos permite expresar relaciones con otras funciones. En esta tarea vamos a soportar: A -> B <: C -> D
si B <: D
y C <: A
. Veamos en acción esta relación
{with : Any {f : {Num -> Num} {fun {x : Num} : Num x}} {with : Any {g : {Num -> Any} {fun {x : Num} : Any #f}} {with : Any {applyTo1 : {{Num -> Any} -> Any} {fun {x : {Num -> Any}} : Any {x 1}}} {applyTo1 g}}}}
En este caso reemplazar g
por f
en el argumento de applyTo1
, es válido pues f
es más específico en su tipo de retorno, por lo que cualquier función que acepta la salida de g
necesariamente acepta la salida de f
.
{with : Num {f : {Num -> Num} {fun {x : Num} : Num x}} {with : Num {h : {Any -> Num} {fun {x : Any} : Num 5}} {with : Num {applyTo1 : {{Num -> Num} -> Num} {fun {x : {Num -> Num}} : Num {x 1}}} {applyTo1 f}}}}
Aquí ocurre que por el tipo del argumento, reemplazar en esa expresión f
por h
también es válido pues si f
puede ser aplicado a un Num
, con mayor razón una función que espera un tipo más general, en este caso Any
.
Entienda la función typeof-with-sub
para que incluya esta relación de subtipos de funciones
(1.0) Sistema de tipos extendido con casts
Vamos a explicar como se comportan los cast con un ejemplo en Java
public void foo(Object obj){ String str = (String)obj; }
En este caso el programador está intentando hacer un cast de Object a String. Esto tiene dos implicancias sobre el lenguaje. Primero, el cast funciona estáticamente como una forma que tiene el programador de expresarle al sistema de tipos que cierto valor tiene cierto tipo, permitiendole en este caso asignar obj
(que es originalmente un Object) a un identificador que espera un String. Segundo, el lenguaje no puede asegurar que el programador no se equivocó, por lo tanto añade en el bytecode generado, una pequeña validación de tipos en runtime que, en caso de fallo lanza un ClassCastException.
Cast para tipos simples
Considere:
{with : Num {id : (Any -> Any) {fun {x : Any} : Any x}} {+ 1 {id 2}}}
Este programa es rechazado por el sistema de tipos pues {f 2}
tiene tipo Any
y no Num
. Podemos agregar un cast para decirle al sistema de tipos que el resultado si es un Num
para que ahora el sistema de tipos acepte el programa:
{+ 1 {cast Num {id 2}}}
En tiempo de ejecución, tal como en el caso en Java, puede ocurrir que el elemento casteado no retorne un Num. Para evitar que la maquina terminare con un SEGFAULT se hace una válida dinámica en la máquina para un cast.
- Implemente la función
(typeof-with-cast expr)
que recibe un nodo del AST y retorna el tipo correspondiente a él o falla en caso de que la expresión no sea válida. Considere que(typeof-with-cast expr)
se comporta igual que la función(typeof-with-sub expr)
de la pregunta anterior, salvo que ahora trabajará con casts. Además:- Añada
cast
a la gramática y al AST de expresiones - Modifique las funciones
parse
ydeBruijn
para soportar el nuevo nodocast
> (parse '{cast Num #f}) (cast (TNum) (bool #f))
- Actualice la función
çompile
para que genere unCHECKCAST
para un expresióncast
.> (compile (parse '{cast Num (and #t #f)})) (list (BOOL_CONST #f) (BOOL_CONST #t) (AND) (CHECKCAST (MTNum)))
- Implemente la función
(typed-compile s-expr)
que se encarga de todo el proceso de generación de código desde unaS-Expr
, considerando el parsing, la nueva validación de tipos, la transformación con índices De Bruijn y el paso a listas de instrucciones que considera incluir la instrucción(CHECKCAST type)
para hacer validación dinámica de tipos.
Casts para funciones
El siguiente ejemplo no se puede ejecutar actualmente pues el sistema de tipos lo rechaza.
{with : Bool {id : (Any -> Any) {fun {x : Any} : Any x}} {with : Bool {g : ((Bool -> Bool) -> Bool) {fun {f : (Bool -> Bool)} : Bool {f #t}}} {with : Bool {f : (Bool -> Bool) {fun {x : Bool} : Bool x}} {g {id f}}}}}
Esto sería solucionable si pudiésemos también castear funciones de la siguiente la forma:
{cast (Bool -> Bool) {id f}}
Teniendo una forma de castear funciones, podemos hacer que el sistema de tipos acepte el código anterior.
{with : Bool {id : (Any -> Any) {fun {x : Any} : Any x}} {with : Bool {g : ((Bool -> Bool) -> Bool) {fun {f : (Bool -> Bool)} : Bool {f #t}}} {with : Bool {f : (Bool -> Bool) {fun {x : Bool} : Bool x}} {g {cast (Bool -> Bool) {id f}}}}}}
Para que la máquina sea capaz de realizar un cast entre funciones, debe implementar la función (m-subtype? mT1 mT2)
del fichero machine.rkt. La función m-subtype?
evalúa a #t
si mT1
es subtipo de mT2
incluyendo la noción de subtipos entre funciones
> (m-subtype? (MTFun (MTNum) (MTNum)) (MTFun (MTNum) (MTAny))) #t