3. Código fuente para los ejemplos de optimización de control difuso con PSO#

En este anexo se incluye el código fuente utilizado para optimizar un controlador difuso (FIS) mediante Particle Swarm Optimization (PSO). El flujo de trabajo general es:

tunable_fuzzy.py construye un FIS parametrizable y genera un controlador callable.
evaluate_controller.py evalúa el controlador como una caja negra y devuelve un valor escalar (fitness), típicamente el RMSE.
pso.py ejecuta PSO (con DEAP) para minimizar el RMSE del controlador parametrizable.
best_controller.json guarda el mejor vector de parámetros encontrado, también las ruta utilizadas para el entrenamiento.
show_controller.py carga el mejor controlador y permite visualizar una ruta específica (animación, gráficas y funciones de membresía).

3.1. Estructura de archivos#

El directorio del ejemplo contiene los siguientes archivos:

fuzzy_code/
├── tunable_fuzzy.py
├── evaluate_controller.py
├── pso.py
├── show_controller.py
└── best_controller.json

Nota

Este anexo documenta los archivos específicos de la optimización con PSO. La simulación del robot tipo bicicleta y la generación de rutas (por ejemplo rear_wheel_sim.py y path.py) se describen en el anexo anterior de la simulación y se reutilizan sin cambios.

3.2. `tunable_fuzzy.py`#

Este archivo define el FIS ajustable. Su responsabilidad es:

Construir el sistema de inferencia difusa a partir de parámetros (por ejemplo, un vector de float).
Proveer una función get_controller(params) que regresa un controlador callable con interfaz:

\[(e_{th}, e) \;\longrightarrow\; \omega\]

FIS parametrizable para optimización (tunable_fuzzy.py)#

import numpy as np
import skfuzzy as fuzz
from skfuzzy import control as ctrl

def clamp(x, lo, hi):
   return max(lo, min(hi, x))

def decode_params(x):
   """
   Convierte un vector (lista de floats) en un diccionario de parámetros.

   x : list[float]
       Vector que produce PSO. En este ejemplo se asume longitud 6.
   """
   assert len(x) == 6

   # Interpretación: parámetros simétricos por variable en universo [-1, 1]
   e_z, e_a, eth_z, eth_a, w_z, w_a = x

   # Límites básicos para mantener MFs válidas y estables
   # - z controla el ancho de la zona "cero" (debe ser pequeño)
   # - a controla dónde empieza la saturación de NS/PS (debe ser mayor que z)
   e_z   = clamp(e_z,   0.05, 0.60)
   e_a   = clamp(e_a,   0.10, 1.00)
   eth_z = clamp(eth_z, 0.05, 0.60)
   eth_a = clamp(eth_a, 0.10, 1.00)
   w_z   = clamp(w_z,   0.05, 0.80)
   w_a   = clamp(w_a,   0.10, 1.00)

   # Asegurar orden: a >= z + margen
   margin = 0.05
   e_a   = max(e_a,   e_z   + margin)
   eth_a = max(eth_a, eth_z + margin)
   w_a   = max(w_a,   w_z   + margin)

   params = {
       "e_z": e_z, "e_a": e_a,
       "eth_z": eth_z, "eth_a": eth_a,
       "w_z": w_z, "w_a": w_a,
   }

   return params

def build_fis(params=None):
    """
    Construye el sistema de inferencia difusa (FIS).

    params: dict | None
        Parámetros opcionales para modificar las funciones de membresía.
        En esta versión base, se ignoran o se usan valores por defecto.
    """
    p = decode_params(params)
    eth_z = p["eth_z"]
    eth_a = p["eth_a"]
    e_z   = p["e_z"]
    e_a   = p["e_a"]
    w_z   = p["w_z"]
    w_a   = p["w_a"]

    # Universos (normalizados)
    e_th = ctrl.Antecedent(np.linspace(-1.0, 1.0, 201), "e_th")   # adimensional
    e    = ctrl.Antecedent(np.linspace(-1.0, 1.0, 201), "e")      # adimensional
    omega = ctrl.Consequent(np.linspace(-1.0, 1.0, 201), "omega") # adimensional

    e_th["NS"] = fuzz.trapmf(e_th.universe, [-1.0, -1.0, -eth_a, 0.0])
    e_th["Z"]  = fuzz.trimf(e_th.universe,  [-eth_z,  0.0,  eth_z])
    e_th["PS"] = fuzz.trapmf(e_th.universe, [ 0.0,  eth_a,  1.0, 1.0])

    e["NS"] = fuzz.trapmf(e.universe, [-1.0, -1.0, -e_a, 0.0])
    e["Z"]  = fuzz.trimf(e.universe,  [-e_z,  0.0,  e_z])
    e["PS"] = fuzz.trapmf(e.universe, [ 0.0,  e_a,  1.0, 1.0])

    omega["NS"] = fuzz.trapmf(omega.universe, [-1.0, -1.0, -w_a, 0.0])
    omega["Z"]  = fuzz.trimf(omega.universe,  [-w_z,  0.0,  w_z])
    omega["PS"] = fuzz.trapmf(omega.universe, [ 0.0,  w_a,  1.0, 1.0])


    # Reglas explícitas (3x3)
    rules = [
        ctrl.Rule(e_th['NS'] & e['NS'], omega['PS']),
        ctrl.Rule(e_th['NS'] & e['Z'], omega['PS']),
        ctrl.Rule(e_th['NS'] & e['PS'], omega['Z']),

        ctrl.Rule(e_th['Z'] & e['NS'], omega['PS']),
        ctrl.Rule(e_th['Z'] & e['Z'], omega['Z']),
        ctrl.Rule(e_th['Z'] & e['PS'], omega['NS']),

        ctrl.Rule(e_th['PS'] & e['NS'], omega['Z']),
        ctrl.Rule(e_th['PS'] & e['Z'], omega['NS']),
        ctrl.Rule(e_th['PS'] & e['PS'], omega['NS']),
    ]

    fis = ctrl.ControlSystem(rules)
    return fis


def get_controller(params=None):
    fis = build_fis(params)
    sim = ctrl.ControlSystemSimulation(fis)

    # Escalas físicas (baseline)
    ETH_MAX = 1.5   # rad
    E_MAX = 3.0     # m
    OMEGA_MAX = 8.0 # rad/s

    def controller(e_th, e):
        # 1) Normalizar entradas
        e_th_n = clamp(float(e_th) / ETH_MAX,-1.0,1.0)
        e_n = clamp(float(e) / E_MAX,-1.0,1.0)

        # 2) Evaluar FIS
        sim.reset()
        sim.input["e_th"] = e_th_n
        sim.input["e"] = e_n
        sim.compute()

        # 3) Desnormalizar salida
        omega_n = float(sim.output["omega"])
        omega = OMEGA_MAX * omega_n
        return omega

    return controller


def plot_mfs(params=None):
    """
   Visualiza las funciones de membresía (modo exploración).
   """
    fis = build_fis(params)
    for variable in fis.fuzzy_variables:
        variable.view()
    

if __name__ == "__main__":
    # Ejecuta: python my_fis.py
    # para inspeccionar las funciones de membresía.
    plot_mfs()

3.3. `evaluate_controller.py`#

Este script implementa la función objetivo (fitness). En la práctica:

Recibe un vector de parámetros (o None para usar el controlador base).
Construye el controlador difuso mediante tunable_fuzzy.get_controller.
Ejecuta la simulación sobre un conjunto fijo de rutas.
Calcula el desempeño (por ejemplo, RMSE del error lateral).
Penaliza escenarios donde el robot no llega a la meta o pierde la referencia.

Evaluación del controlador como función objetivo (evaluate_controller.py)#

import tunable_fuzzy as fc
import rear_wheel_sim as rw_sim
import path
import numpy as np

def compute_rmse(traces):
    errors = np.array([tr.error for tr in traces])
    return np.sqrt(np.mean(errors**2))

def evaluate_controller(params):

    paths = [
        ([0.0, 6.0, 12.5, 5.0, 7.5, 3.0, -1.0], [0.0, 0.0, 5.0, 6.5, 3.0, 5.0, -2.0]),
        ([0.0, 1.0, 2.5, 5.0, 7.5, 3.0, -1.0], [0.0, -4.0, 6.0, 6.5, 3.0, 5.0, -2.0]),
        ([0.0, 2.0, 2.5, 5.0, 7.5, -3.0, -1.0], [0.0, 3.0, 6.0, 6.5, 5.0, 5.0, -2.0]),
    ]
    
    controller = None
    
    if params:
        controller = fc.get_controller(params)
    
    rmses = []
    for ax, ay in paths:
        goal = [ax[-1], ay[-1]]
        reference_path = path.CubicSplinePath(ax, ay)

        result = rw_sim.simulacion(
            reference_path,
            goal,
            controller=controller,
        )
        if not result['goal_flag']:
            return float(10.0), # Return Tuple for DEAP
        if result['error_flag']:
            return float(10.0), # Return Tuple for DEAP

        traces = result["traces"]
        rmse = compute_rmse(traces)
        rmses.append(rmse)
        #print(result['goal_flag'], result['error_flag'], rmse)
        # Visualización (opcional): se ejecuta después de la simulación
        #rw_sim.animate(result, pause=0.001)
        #rw_sim.plot(result)
        #fc.plot_mfs(params=params)
    #print(np.mean(rmses))
    return float(np.mean(rmses)), # Return Tuple for DEAP

3.4. `pso.py`#

Implementación del algoritmo PSO utilizando DEAP. Su función es:

Definir la representación de la partícula (posición/velocidad/mejor histórico).
Definir el espacio de búsqueda (rangos mínimos y máximos por parámetro).
Ejecutar el ciclo de optimización llamando a evaluate_controller.py.
Imprime el mejor vector de parámetros.

Optimización del FIS mediante PSO (pso.py)#

import operator
import random

import numpy
import math

from deap import base
from deap import creator
from deap import tools

from evaluate_controller import evaluate_controller
creator.create("FitnessMin", base.Fitness, weights=(-1.0,))
creator.create("Particle", list, fitness=creator.FitnessMin, speed=list,
    smin=None, smax=None, best=None)

def generate(size, pmin, pmax, smin, smax):
    part = creator.Particle(random.uniform(pmin, pmax) for _ in range(size))
    part.speed = [random.uniform(smin, smax) for _ in range(size)]
    part.smin = smin
    part.smax = smax
    return part

def updateParticle(part, best, phi1, phi2):
    u1 = (random.uniform(0, phi1) for _ in range(len(part)))
    u2 = (random.uniform(0, phi2) for _ in range(len(part)))
    v_u1 = map(operator.mul, u1, map(operator.sub, part.best, part))
    v_u2 = map(operator.mul, u2, map(operator.sub, best, part))
    part.speed = list(map(operator.add, part.speed, map(operator.add, v_u1, v_u2)))
    for i, speed in enumerate(part.speed):
        if abs(speed) < part.smin:
            part.speed[i] = math.copysign(part.smin, speed)
        elif abs(speed) > part.smax:
            part.speed[i] = math.copysign(part.smax, speed)
    part[:] = list(map(operator.add, part, part.speed))

toolbox = base.Toolbox()
toolbox.register("particle", generate, size=6, pmin=-0.05, pmax=1.5, smin=-0.1, smax=0.1)
toolbox.register("population", tools.initRepeat, list, toolbox.particle)
toolbox.register("update", updateParticle, phi1=2.0, phi2=2.0)toolbox.register("evaluate", evaluate_controller)

def main():
    pop = toolbox.population(n=50)
    stats = tools.Statistics(lambda ind: ind.fitness.values)
    stats.register("avg", numpy.mean)
    stats.register("std", numpy.std)
    stats.register("min", numpy.min)
    stats.register("max", numpy.max)

    logbook = tools.Logbook()
    logbook.header = ["gen", "evals"] + stats.fields

    GEN = 20
    best = None

    for g in range(GEN):
        for part in pop:
            part.fitness.values = toolbox.evaluate(part)
            if not part.best or part.best.fitness < part.fitness:
                part.best = creator.Particle(part)
                part.best.fitness.values = part.fitness.values
            if not best or best.fitness < part.fitness:
                best = creator.Particle(part)
                best.fitness.values = part.fitness.values

        for part in pop:
            toolbox.update(part, best)
        # Gather all the fitnesses in one list and print the stats
        logbook.record(gen=g, evals=len(pop), **stats.compile(pop))
        print(logbook.stream)
    print(best.fitness, best.fitness.values, part.best.fitness, part.fitness.values)
    return pop, logbook, best

if __name__ == "__main__":
    main()

3.5. `best_controller.json`#

Archivo de configuración que guarda el mejor controlador encontrado. Contiene principalmente:

params: vector de parámetros (lista de float) que define el FIS.
(Opcional) rutas utilizadas, métricas y metadatos para reproducibilidad.

Mejor controlador encontrado (best_controller.json)#

{
  "params": [0.02906318670445844, 0.5689901881492568, 0.959185644460144, 0.11181303651379565, 0.09595559801638323, 0.3875820435302194],
  "paths": [
    {"ax": [0.0, 6.0, 12.5, 5.0, 7.5, 3.0, -1.0], "ay": [0.0, 0.0, 5.0, 6.5, 3.0, 5.0, -2.0]},
    {"ax": [0.0, 1.0, 2.5, 5.0, 7.5, 3.0, -1.0], "ay": [0.0, -4.0, 6.0, 6.5, 3.0, 5.0, -2.0]},
    {"ax": [0.0, 2.0, 2.5, 5.0, 7.5, -3.0, -1.0], "ay": [0.0, 3.0, 6.0, 6.5, 5.0, 5.0, -2.0]}
  ],
  "notes": "Best found by PSO"
}

3.6. `show_controller.py`#

Script de visualización y diagnóstico. Este archivo:

Carga best_controller.json.
Construye el controlador difuso con esos parámetros.
Ejecuta la simulación sobre una ruta específica (por índice).
Muestra animación y gráficas del seguimiento.
Despliega las funciones de membresía resultantes.

Visualización del mejor controlador (show_controller.py)#

import json
import tunable_fuzzy as fc
from evaluate_controller import compute_rmse
import rear_wheel_sim as rw_sim
import path
import argparse

def load_config(path_cfg):
    with open(path_cfg, "r") as f:
        cfg = json.load(f)
    params = cfg["params"]
    paths = [(p["ax"], p["ay"]) for p in cfg["paths"]]
    return params, paths, cfg

def show_controller(params, paths, path_id):

    controller = fc.get_controller(params)

    ax, ay = paths[path_id]
    goal = [ax[-1], ay[-1]]
    reference_path = path.CubicSplinePath(ax, ay)
    result = rw_sim.simulacion(
        reference_path,
        goal,
        controller=controller,
    )
    if not result['goal_flag']:
        print("⚠️  No se alcanzó la meta")
    if result['error_flag']:
        print("⚠️  Error en la simulación")

    traces = result["traces"]
    rmse = compute_rmse(traces)
    print('rmse: {rmse}')

    rw_sim.animate(result, pause=0.001)
    rw_sim.plot(result)
    fc.plot_mfs(params=params)

if __name__ == "__main__":
    parser = argparse.ArgumentParser(
        description="Visualiza el controlador difuso para una ruta específica"
    )
    parser.add_argument(
        "path_id",
        type=int,
        nargs="?",
        default=0,
        help="Índice de la ruta a mostrar (default: 0)",
    )
    parser.add_argument(
        "--config",
        type=str,
        default="best_controller.json",
        help="Archivo de configuración del controlador",
    )

    args = parser.parse_args()

    params, paths, cfg = load_config(args.config)

    if args.path_id < 0 or args.path_id >= len(paths):
        raise ValueError(f"path_id debe estar entre 0 y {len(paths)-1}")

    show_controller(params, paths, path_id=args.path_id)

3.7. Ejemplo de uso#

Para mostrar el mejor controlador sobre una ruta específica (por ejemplo, la ruta con índice 2) y la ubicación del archivo con la configuración del FIS:

python show_controller.py 2 --configure ./best_controller.json

Para ejecutar la optimización con PSO (puede tomar tiempo dependiendo del número de partículas y generaciones):

python pso.py

4. Código fuente para los ejemplos de Escalado Computacional#

El siguiente archivo muestra la versión del algoritmo PSO donde la evaluación de la aptitud de cada partícula se realiza en paralelo utilizando tareas remotas de Ray. El resto del algoritmo se ejecuta de manera secuencial en un solo proceso coordinador.

Uso de Ray para ejecutar la evaluación distribuida (pso_ray.py)#

import operator
import random

import numpy
import math

from deap import base
from deap import creator
from deap import tools

import ray
from evaluate_controller import evaluate_controller

@ray.remote
def remote_ev_controller(particle):
    return evaluate_controller(particle)


creator.create("FitnessMin", base.Fitness, weights=(-1.0,))
creator.create("Particle", list, fitness=creator.FitnessMin, speed=list,
    smin=None, smax=None, best=None)



def generate(size, pmin, pmax, smin, smax):
    part = creator.Particle(random.uniform(pmin, pmax) for _ in range(size))
    part.speed = [random.uniform(smin, smax) for _ in range(size)]
    part.smin = smin
    part.smax = smax
    return part

def updateParticle(part, best, phi1, phi2):
    u1 = (random.uniform(0, phi1) for _ in range(len(part)))
    u2 = (random.uniform(0, phi2) for _ in range(len(part)))
    v_u1 = map(operator.mul, u1, map(operator.sub, part.best, part))
    v_u2 = map(operator.mul, u2, map(operator.sub, best, part))
    part.speed = list(map(operator.add, part.speed, map(operator.add, v_u1, v_u2)))
    for i, speed in enumerate(part.speed):
        if abs(speed) < part.smin:
            part.speed[i] = math.copysign(part.smin, speed)
        elif abs(speed) > part.smax:
            part.speed[i] = math.copysign(part.smax, speed)
    part[:] = list(map(operator.add, part, part.speed))

toolbox = base.Toolbox()
toolbox.register("particle", generate, size=6, pmin=-0.05, pmax=1.5, smin=-0.1, smax=0.1)
toolbox.register("population", tools.initRepeat, list, toolbox.particle)
toolbox.register("update", updateParticle, phi1=2.0, phi2=2.0)
#toolbox.register("evaluate", ev_controller)


def evaluate_population_ray(pop):
    futures_fitness_values = [remote_ev_controller.remote(list(particle)) for particle in pop] 
    results = ray.get(futures_fitness_values)
    assert len(pop) == len(results)
    
    for i, part in enumerate(pop):
        part.fitness.values = results[i]
    return pop

def main():
    pop = toolbox.population(n=50)
    stats = tools.Statistics(lambda ind: ind.fitness.values)
    stats.register("avg", numpy.mean)
    stats.register("std", numpy.std)
    stats.register("min", numpy.min)
    stats.register("max", numpy.max)

    logbook = tools.Logbook()
    logbook.header = ["gen", "evals"] + stats.fields

    GEN = 20
    best = None
    

    for g in range(GEN):
        evaluate_population_ray(pop)
        for part in pop:
            # No calculamos el fitnes utilizando el toolbox
            # lo hacemos con la función evaluate_population_ray(pop)

            # part.fitness.values = toolbox.evaluate(part)
        
            # Se compara el fitness no el valor del RMSE
            # en este caso los controladores con menor RMSE
            # tienen un mayor fitness. DEAP internamente 
            # hace la multiplicación por -1 ya que estamos minimizando. 
            if not part.best or part.best.fitness < part.fitness:
                part.best = creator.Particle(part)
                part.best.fitness.values = part.fitness.values
            if not best or best.fitness < part.fitness:
                best = creator.Particle(part)
                best.fitness.values = part.fitness.values

        for part in pop:
            toolbox.update(part, best)
        # Gather all the fitnesses in one list and print the stats
        logbook.record(gen=g, evals=len(pop), **stats.compile(pop))
        print(logbook.stream)
        
    print(best.fitness.values, best)
    return pop, logbook, best

if __name__ == "__main__":
    ray.init()
    main()
    ray.shutdown()

A continuación se muestra el código completo del ejemplo de PSO multi-enjambre, donde cada población se implementa como un actor con estado (SwarmAgent). En este caso, Ray se utiliza tanto para ejecutar evaluaciones stateless como para mantener poblaciones persistentes que evolucionan y migran soluciones de manera coordinada.

Uso de Ray para implementar PSO multi-enjambre (pso_agent.py)#

import random

import ray
from dataclasses import dataclass, field
from typing import List, Tuple, Dict
from evaluate_controller import evaluate_controller


@ray.remote
def remote_ev_controller(x: List[float]) -> float:
    fitness = evaluate_controller(x)
    # Normaliza a float aunque venga como (val,)
    if isinstance(fitness, tuple):
        return float(fitness[0])
    return float(fitness)

def clip(value: float, vmin: float, vmax: float) -> float:
    return max(vmin, min(vmax, value))

@dataclass
class Particle:
    """
    Partícula para PSO.

    Attributes
    ----------
    x : list[float]
        Posición (solución candidata).
    v : list[float]
        Velocidad.
    best_x : list[float]
        Mejor posición personal encontrada hasta el momento.
    best_f : float
        Mejor valor de fitness (a minimizar) asociado a best_x.
    """
    x: List[float] = field(default_factory=list)
    speed: List[float] = field(default_factory=list)
    fitness: float = float('inf')
    best_x: List[float] = field(default_factory=list)
    best_f: float = float("inf")
    
    def __repr__(self) -> str:
        return f"Particle(f={self.fitness:.4f}, x={[round(v, 3) for v in self.x]})"

    def __str__(self) -> str:
        return (
            "Particle(\n"
            f"  fitness = {self.fitness:.6f}\n"
            f"  x        = {[round(v, 4) for v in self.x]}\n"
            f"  speed    = {[round(v, 4) for v in self.speed]}\n"
            f"  best_f   = {self.best_f:.6f}\n"
            f"  best_x   = {[round(v, 4) for v in self.best_x]}\n"
            ")"
        )

@ray.remote
class SwarmAgent:
    def __init__(self, config: Dict) -> None:
        self.config = config
        self.swarm_size = int(config["swarm_size"])
        self.size = int(config['dim'])

        self.smin = float(config['smin'])
        self.smax = float(config['smax'])
        self.pmax = float(config['pmax'])
        self.pmin = float(config['pmin'])
        self.weight = float(config.get("w", 0.7))
        self.phi1 = float(config['phi1'])
        self.phi2 = float(config['phi2'])
        self.pop: List[Particle] = [self.generate() for _ in range(self.swarm_size)]
        self.gbest = Particle(
            x=self.pop[0].x.copy(),
            speed=[0.0] * self.size,
            fitness=float("inf"),
            best_x=self.pop[0].x.copy(),
            best_f=float("inf"),
        )

    def generate(self) -> Particle:
        x = [random.uniform(self.pmin, self.pmax) for _ in range(self.size)]
        speed = [random.uniform(self.smin, self.smax) for _ in range(self.size)]
        return Particle(x=x, speed=speed, fitness=float("inf"), best_x=x.copy(), best_f=float("inf"))

    def _update_particle(self, p: Particle) -> None:
        for d in range(self.size):
            r1 = random.random()
            r2 = random.random()

            cognitive = self.phi1 * r1 * (p.best_x[d] - p.x[d])
            social = self.phi2 * r2 * (self.gbest.x[d] - p.x[d])

            p.speed[d] = self.weight * p.speed[d] + cognitive + social
            p.speed[d] = clip(p.speed[d], self.smin, self.smax)

            p.x[d] = p.x[d] + p.speed[d]
            p.x[d] = clip(p.x[d], self.pmin, self.pmax)


    def evaluate_population_ray(self):
        futures_fitness_values = [remote_ev_controller.remote(list(particle.x)) for particle in self.pop] 
        results = ray.get(futures_fitness_values)
        assert len(self.pop) == len(results)
        
        for p, f in zip(self.pop, results):
            p.fitness = f

            if f < p.best_f:
                p.best_f = f
                p.best_x = p.x.copy()

            if f < self.gbest.fitness:
                self.gbest.fitness = f
                self.gbest.x = p.x.copy()
                self.gbest.best_f = f
                self.gbest.best_x = p.x.copy()

 
    def migrate(self, candidates: List[Tuple[float, List[float]]]) -> None:
        """
        candidates: lista de (fitness, x) (tipos planos).
        Reemplaza las peores partículas por estos candidatos.
        """
        # Asegurar fitness actualizado para identificar peores
        self.evaluate_population_ray()

        # Peores primero
        worst_idx = sorted(range(self.swarm_size), key=lambda i: self.pop[i].fitness, reverse=True)
        k = min(len(candidates), self.swarm_size)

        for j in range(k):
            f_cand, x_cand = candidates[j]
            i = worst_idx[j]
            # Insertar candidato con velocidad nueva (para no heredar dinámica ajena)
            self.pop[i] = Particle(
                x=list(x_cand),
                speed=[random.uniform(self.smin, self.smax) for _ in range(self.size)],
                fitness=float(f_cand),
                best_x=list(x_cand),
                best_f=float(f_cand),
            )

            if f_cand < self.gbest.fitness:
                self.gbest.fitness = float(f_cand)
                self.gbest.x = list(x_cand)


    def step(self, n_iters: int) -> Particle:
        for _ in range(n_iters):
            self.evaluate_population_ray()
            for part in self.pop:
                self._update_particle(part)
            # Gather all the fitnesses in one list and print the stats
            # print(logbook.stream)
        return self.gbest


config = {
    "smin": -0.2,
    "smax":  0.20,
    "pmin": 0.0,
    "pmax": 1.0,
    "phi1": 2.0,
    "phi2": 2.0,

    "dim": 6,
    "swarm_size": 10,

    "ngen": 4,
    "migrate_interval":2,
    "migrate_k":2,
    "num_swarms": 6,
    "num_rounds": 8,
}


import os
os.environ["RAY_ACCEL_ENV_VAR_OVERRIDE_ON_ZERO"] = "0"
os.environ["RAY_DISABLE_DASHBOARD"] = "1"
os.environ["RAY_USAGE_STATS_ENABLED"] = "0"

ray.init(ignore_reinit_error=True, include_dashboard=False)

try:
    agents = [SwarmAgent.remote(config) for i in range(config['num_swarms'])
    ]
   
    best_global = Particle()

    for r in range(config["num_rounds"]):
       # 1) Cada agente ejecuta varias iteraciones locales en paralelo
       futures = [a.step.remote(config['ngen']) for a in agents]
       bests = [best for best in ray.get(futures)]  # [(f, x), ...]
       bests.sort(key=lambda best: best.fitness) 

       # 2) Actualizar mejor global
       best = bests[0]
       if best_global.fitness > best.fitness:
           best_global.x = best.x[:] 
           best_global.fitness  = best.fitness
       print(f"Ronda {r:02d} | Mejor: {best_global.fitness:.6f}")
       
       # 3) Migración: intercambio de candidatos entre agentes
       if (r + 1) % int(config["migrate_interval"]) == 0:
           print("Migrando")
           migration_futures = []
           migration_particles = [(particle.fitness, particle.x)  for particle in bests[:config['migrate_k']]]
           for a in agents:
               # Candidatos: enviamos los k mejores a los otros agentes 
               migration_futures.append(a.migrate.remote(migration_particles))
           ray.get(migration_futures)
    print(f"Mejor global: {best_global.fitness:.6f} | {best_global.x}")
finally:
    ray.shutdown()

Código fuente para los ejemplos de optimización de control difuso con PSO

Contenido

3. Código fuente para los ejemplos de optimización de control difuso con PSO#

3.1. Estructura de archivos#

3.2. tunable_fuzzy.py#

3.3. evaluate_controller.py#

3.4. pso.py#

3.5. best_controller.json#