This is an old revision of the document!

Tarea 1

Esta tarea se distribuye con tres ficheros start.rkt, machine.rkt y tests.rkt (mediante U-Cursos). Considere las definiciones del archivo machine.rkt (NO! modifique el archivo machine.rkt) y escriba las funciones pedidias en él archivo start.rkt. Escriba sus tests en el archivo test.rkt adjunto. Ambos ficheros (start.rkt y test-rkt) deben ser entregados vía U-Cursos. Los tests forman parte de su evaluación! Consulte las normas de entrega de tareas en http://pleiad.cl/teaching/cc4101.

(1.0) Funciones de primera clase con tipos declarados

En esta tarea haremos extensión a un lenguaje con funciones de primera clase con tipos. La gramática del lenguaje es la mostrada a continuación:

<expr> ::= <num>
         | <bool>
         | <id>
         | {+ <expr> <expr>}
         | {- <expr> <expr>}
         | {= <expr> <expr>}
         | {< <expr> <expr>}
         | {and <expr> <expr>}
         | {or <expr> <expr>}
         | {not <expr>}
         | {if <expr> <expr> <expr>}
         | {with : <TYPE> {<id> : <TYPE> <expr>} <expr>}
         | {fun {<id> : <TYPE>} : <TYPE> <expr>}
         | {<expr> <expr>}         
 
<TYPE> ::= Num
         | Bool
         | {<TYPE> -> <TYPE>}

(0.4) Defina la función (parse-t s-expr) que parsea solo la gramática de tipos que se inicia del no terminal <TYPE>. Ademas en caso de error, debe retornar el error “PARSE ERROR”
```
> (parse-t '{{Num -> Num} -> Bool})
(TFun (TFun (TNum) (TNum)) (TBool))
 
> (parse-t '{{Num ->  })
PARSE ERROR
```
(0.6) Defina la función (parse expr) para que acepte la gramática con números, booleans y funciones de primera clase con tipos. Utilice la función (parse-t s-expr) en los puntos donde deba identificar tipos. La función parse debe reemplazar el with por una aplicación de función como se ha visto en clases
```
> (parse '{fun {x : Num} : Bool #f})
(fun 'x (TNum) (bool #f) (TBool))
> (parse '{with : Num {y : Num 2}
                                 {+ x y}})
(app (fun 'y (TNum) (add (id 'x) (id 'y)) (TNum)) (num 2))
```

(2.0) Compilación

Ahora vamos a compilar nuestro lenguaje a una máquina abstracta basada en stack. La máquina es similar a la conocida SECD¹⁾, la cual no trabaja con identificadores, sino que solo con índices. La máquina SECD consume una lista de instrucciones, utiliza una stack para almacenar datos temporales y posee un ambiente que, a diferencia del ambiente visto normalmente en el curso, es un arreglo con valores sin identificadores. La máquina SECD ya esta definida en el archivo machine.rkt. La función (machine ins-list) le permitirá ejecutar una lista de instrucciones en la máquina.

> (machine (list (INT-CONST 6) (INT-CONST 1) (ADD)))
7

Tome un tiempo para experimentar con la función machine y el set de instrucciones antes de realizar los próximos ejercicios.

Índices De Bruijn

Una forma de eliminar nombres de variables o identificadores de una expresión, es usando índices De Bruijn. Anteriormente vimos que la máquina SECD trabaja solo con índices, por lo que en esta sección vamos a hacer el paso de identificadores a dichos números, usando indices De Bruijn²⁾.

(1.0) Implemente la función deBruijn que toma una expresión y la recorre reemplazando los identificadores no libres, con los índices De Bruijn (nodos (acc n)) manteniendo el scope léxico. La salida de esta función no debería tener nodos del tipo fun ni id. En su lugar debería contener nodos del tipo fun-db y acc. El resto de los nodos no varía.

hint: le podría ser útil usar una función auxiliar

> (deBruijn 
   (parse '{+ 1 {with : Num {x : Num 1}
                           {with : Num {y : Num 2}
                                 {+ x y}}}}))
(add
 (num 1)
 (app
  (fun-db
   (app (fun-db (add (acc 1) (acc 0)) (TFun (TNum) (TNum))) (num 2))
   (TFun (TNum) (TNum)))
  (num 1)))
 
> (deBruijn (add (num 1) (id 'x)))
;Arroja error "UNBOUND IDENTIFIER"

De AST a código de máquina

Vamos abordar la compilación del AST de una expresión al set de instrucciones de la SECD. A continuación se presenta el esquema de compilación que permite hacer el paso del lenguaje original a listas de instrucciones. Note que solo es el paso a notación polaca inversa:

C(n) -> INT-CONST n
C(b) -> BOOL-CONST b
C(n) -> ACCESS n
C({+ a1 a2}) = C(a2);C(a1);ADD
C({- a1 a2}) = C(a2);C(a1);SUB
C({< a1 a2}) = C(a2);C(a1);LESS
C({= a1 a2}) = C(a2);C(a1);EQ
C({and a1 a2}) = C(a2);C(a1);AND
C({or a1 a2}) = C(a2);C(a1);OR
C({not a1}) = C(a1);NOT
C({f a}) = C(a); C(f); APPLY
C({if c tb fb}) = C(c); IF(C(tb),C(fb))

La compilación de una función puede ser inferida del ejemplo a continuación:

> (compile (deBruijn (parse '{{fun {x : Num} : Bool
                                   {< x 10}} {+ 2 3}})))
(list
 (INT-CONST 3)
 (INT-CONST 2)
 (ADD)
 (CLOSURE (list (INT-CONST 10) (ACCESS 0) (LESS) (RETURN)) (MTFun (MTNum) (MTBool)))
 (APPLY))

En el ejemplo anterior se puede notar que los tipos que entiende la máquina no se crean con los constructores de Type. Los tipos en la máquina esta definidos con el deftype MType por lo que debe hacerse una transformación de los tipos de Type a MType. Las reglas para la transformación son:

TNum a MTum
TBool a MTBool
TFun a MTFun aplicando la transformación recursivamente al tipo del argumento y al tipo de retorno

(1.0) Implemente la función (compile expr) que dado una expresión con índices De Bruijn genera la lista de instrucciones siguiendo el esquema de compilación descrito anteriormente

(0.5) Sistemas de Tipos Simple

Se implementará el chequeo de tipos de una expresión en presencia de funciones de primera clase.

Implemente la función (typeof expr) que recibe un nodo del AST y retorna el tipo correspondiente a la expresión o falla con TYPE_ERROR en caso de que la expresión no sea valida por validación de tipos considerando lo siguiente:
- Para una función se válida que la expresión del cuerpo tenga el mismo tipo declarado en el retorno de la función. En caso de pasar la validación el tipo resultante es (TFun targ tbody), donde targ es el tipo del argumento y tbody es el tipo de retorno de la función.
- Para la aplicación de función se valida que el primer argumento es efectivamente una función y que el tipo del segundo argumento de la aplicación (argumento real) coincide con el tipo del argumento (formal) de la función. En dicho caso la aplicación tiene el tipo del retorno de la función.

  > (typeof (parse '{fun {f : Num} : Bool #t}))
  (TFun (TNum) (TBool))
  > (typeof (parse '{{fun {f : Num} : Bool #t} #t}))
  ;Arroja error "TYPE_ERROR"

Para el if ambas ramas deben ser del mismo tipo, es decir al tipear {if #t 1 6} debe ser del tipo TNum, en cambio {if #t 1 #f} debe retornar el mensaje de error “TYPE_ERROR”

(1.5) Sistema de tipos con relación de subtipos

Vamos a introducir el tipo Any a nuestro lenguaje. Esto significa que vamos a comenzar a considerar relaciones de subtipo. En la literatura relacionada, la relación de subtipos se escribe A <: B y se lee como A es subtipo de B.

Tipos Simples

Considere para esta pregunta las relaciones Num <: Any y Bool <: Any y que para todo tipo A se tiene A <: A.

Implemente la función (typeof-with-sub expr) que recibe un nodo del AST y retorna el tipo correspondiente a el o falla con TYPE_ERROR en caso de que la expresión no sea válida. Considere que (typeof-with-sub expr) se comporta igual que la función (typeof expr) de la pregunta anterior, salvo por:

La existencia de Any permite tipear {if #t 1 #f} como del tipo TAny³⁾. Es decir que frente a tipos distintos en las ramas el resultado es TAny.
En la definición de función, el cuerpo puede ser subtipo del tipo declarado de salida de la función
En la aplicación de función, el tipo del argumento puede ser subtipo del tipo declarado del argumento de la función.

Subtipos de funciones

En esta sección considere que A -> B <: Any. La noción de subtipos de funciones es muy simple y nos permite expresar relaciones con otras funciones. En esta tarea vamos a soportar: A -> B <: C -> D si B <: D y C <: A. Veamos en acción esta relación

{with : Any {f : {Num -> Num}
                  {fun {x : Num} : Num x}}
         {with : Any {g : {Num -> Any}
                        {fun {x : Num} : Any #f}}
               {with : Any {applyTo1 : {{Num -> Any} -> Any}
                                     {fun {x : {Num -> Any}} : Any {x 1}}}
                     {applyTo1 g}}}}

En este caso reemplazar g por f en el argumento de applyTo1, es válido pues f es más específico en su tipo de retorno, por lo que cualquier función que acepta la salida de g necesariamente acepta la salida de f.

{with : Num {f : {Num -> Num}
                  {fun {x : Num} : Num x}}                                 
         {with : Num {h : {Any -> Num}
                        {fun {x : Any} : Num 5}}
               {with : Num {applyTo1 : {{Num -> Num} -> Num}
                                     {fun {x : {Num -> Num}} : Num {x 1}}}
                     {applyTo1 f}}}}

Aquí ocurre que por el tipo del argumento, reemplazar en esa expresión f por h también es válido pues si f puede ser aplicado a un Num, con mayor razón una función que espera un tipo más general, en este caso Any. Extienda la función typeof-with-sub para que incluya esta relación de subtipos de funciones

(0.5) Typed compile

Implemente la función (typed-compile s-expr) que se encarga de todo el proceso de generación de código desde una S-Expr, considerando el parsing, la nueva validación de tipos, y la transformación con índices De Bruijn. Note que esta función solo genera código de maquina si la expresión esta bien tipada.

¹⁾

https://en.wikipedia.org/wiki/SECD_machine

²⁾

La explicación detallada de como funcionan se puede encontrar en la sección 3.5 del PLAI

³⁾

variante del tipo Type para Any