Hay un fenómeno en las tecnologias cognitivas que se llama "alucinación", que es cuando el "sistema de autocompletado" escribe sin sentido. Para evitar eso, se "afina" el modelo hasta que tenga sentido (en el sentido de la Habitacion China) y genere buen contenido (o inteligencia).
El punto es que modelos públicos nunca va a ser de gran calidad, porque son gratuitos, de uso general (contestan sobre todo lo que se puede) y se aprovechan de lo que los mismos usuarios libre y gratuitamente le estan cargando en cada transacción HTTP.
Hay una categoria de tecnologias cognitivas que se llama "Sistema Experto", por ejemplo Ollama tiene un LLM experto en crear sentencias SQL,
https://ollama.com/library/sqlcoder
Para que un modelo de lenguaje sea realmente útil y funcione como el exocortex de una persona, en lugar de ser una criatura mítica que roba trabajos, hay que crear pequeños sistemas expertos que acompañen en el proceso de desarrollo de software.
Jetbrains ya invento esta capacidad, pero a la gente no le gusta usarlo porque al final le estas regalando codigo a la empresa, para que cree modelos mas efectivos y puedan venderlos de vuelta a la misma gente que aportó desde sus IDEs.
Creo que la solución va por el que la gente manufacture sus propias redes neuronales artesanales bajo la licencias que se les pare la raja. El gran limitante hasta el momento de lograr esa realidad es la gran demanda de procesamiento que exigen los modelos plantilla tipo Llama, Vicuña, etc.