Aprendizaje profundo
Scientific Reports volumen 13, Número de artículo: 7382 (2023) Citar este artículo
669 Accesos
1 Altmetric
Detalles de métricas
Las microestructuras con propiedades de ingeniería son fundamentales para la gestión térmica en aplicaciones aeroespaciales y espaciales. Debido a la abrumadora cantidad de variables de diseño de microestructuras, los enfoques tradicionales para la optimización de materiales pueden tener procesos que consumen mucho tiempo y casos de uso limitados. Aquí, combinamos una red neuronal óptica sustituta con una red neuronal inversa y un posprocesamiento dinámico para formar un proceso de diseño inverso de red neuronal agregada. Nuestra red sustituta emula simulaciones de dominio de tiempo de diferencia finita (FDTD) mediante el desarrollo de una relación entre la geometría de la microestructura, la longitud de onda, las propiedades discretas del material y las propiedades ópticas de salida. El solucionador óptico sustituto funciona en conjunto con una red neuronal inversa para predecir las propiedades de diseño de una microestructura que coincidirán con un espectro óptico de entrada. A diferencia de los enfoques convencionales que están limitados por la selección de materiales, nuestra red puede identificar nuevas propiedades de materiales que optimicen mejor el espectro de entrada y hagan coincidir la salida con un material existente. El resultado se evalúa utilizando restricciones de diseño críticas, se simula en FDTD y se usa para volver a entrenar al sustituto, formando un ciclo de autoaprendizaje. El marco presentado es aplicable al diseño inverso de varias microestructuras ópticas, y el enfoque derivado del aprendizaje profundo permitirá una optimización compleja y restringida por el usuario para el control de la radiación térmica en futuros sistemas aeroespaciales y espaciales.
Las superficies de ingeniería a nivel microscópico permiten el control de las interacciones entre la materia y la luz del material y son parte integral de las tecnologías en evolución en áreas como el enfriamiento pasivo subambiental1,2,3,4, el calentamiento por radiación5,6 y la termofotovoltaica7,8. El diseño de emisores selectivos para sistemas de gestión térmica radiativa depende de dos espectros de longitud de onda fotónica (λ): el visible (VIS) al infrarrojo cercano (NIR) y el infrarrojo medio (MIR)1,4. Las estructuras de enfriamiento pasivo, materiales que pueden enfriarse pasivamente por debajo de la temperatura ambiente, son superficies diseñadas a partir de materiales como polímeros2,3,9, compuestos10,11,12 y grafeno13,14 para maximizar la emisión térmica en el MIR y minimizar la radiación solar absorbida (λ = 300–2500 nm) aumentando la radiación solar reflejada. Se pueden utilizar métodos como la nanoestructuración15, las estructuras corrugadas6,16, los materiales de núcleo y cubierta17,18 y las rejillas periódicas16,19 para inducir el efecto contrario y aumentar la absorción térmica al mejorar el comportamiento antirreflectante de una superficie. Un método que se puede utilizar para diseñar materiales de calentamiento y enfriamiento radiativos es el texturizado de superficie en "micropirámide" a microescala20. Una forma de rejilla de relieve superficial, la textura micropirámide induce propiedades antirreflectantes debido al importante confinamiento de la luz a través de la combinación de material y geometría20,21,22. Este método puede mejorar significativamente las propiedades antirreflectantes de banda ancha en silicio23,24,25,26,27, metales5,28,29,30,31,32, dieléctricos33 y polímeros34.
El diseño y la optimización de estructuras para controlar selectivamente las propiedades ópticas puede ser un desafío significativo y lento. Más allá del potencial de muchos grados de libertad en el espacio del diseño geométrico, la selección de materiales agrega un nivel adicional de complejidad. Resolver la interacción entre una geometría compleja y la selección de materiales puede requerir una inversión significativa en recursos computacionales y un método numérico dedicado, como un solucionador de dominio de tiempo de diferencia finita (FDTD)35. Un método altamente efectivo que ha surgido para contrarrestar la necesidad de herramientas de simulación complejas es el uso de Deep Learning (DL) para predecir propiedades ópticas. Una rama del aprendizaje automático (ML), los métodos DL han demostrado tener un alto grado de abstracción no lineal de los conjuntos de datos36 y abordar problemas complejos como los automóviles autónomos37, el reconocimiento de voz38 y el procesamiento del lenguaje natural39. Deep Learning se ha utilizado en el campo de la fotónica y la nanofotónica para predecir y modelar problemas como interacciones plasmónicas36,40, estructuras de rejilla41,42,43, partículas44,45 y nanoestructuras46. DL también se ha aplicado ampliamente en el campo de la ingeniería térmica para estudiar temas como la conductividad térmica47, la transferencia de calor por ebullición48 y el transporte térmico radiativo49,50,51.
Deep Learning ha demostrado ser efectivo no solo para predecir el problema "directo" al reemplazar el proceso de solución óptica, sino también para realizar el diseño inverso36,44,45,52,53,54,55,56. El diseño inverso, en términos generales, toma una entrada deseada y genera un conjunto de características que generan la entrada. En comparación con las herramientas de optimización comunes, el diseño inverso a través de métodos de aprendizaje automático es muy eficaz para aumentar el rendimiento y la velocidad de predicción. Existe una multitud de métodos para ejecutar un esquema de diseño inverso en nanofotónica57, pero varios métodos comunes incluyen el uso de un modelo sustituto junto con un método de optimización58,59, la creación de un esquema bidireccional o "tándem"36,44,55, 60,61, y redes antagónicas62,63. Se han aplicado métodos de diseño inverso basados en aprendizaje automático al diseño de estructuras de emisores selectivos; los métodos basados en imágenes64, el aprendizaje profundo65, la búsqueda binaria profunda66, el aprendizaje por transferencia67 y los algoritmos genéticos68,69 han demostrado ser efectivos en estudios previos. Si bien algunos estudios tienen en cuenta la selección de materiales como un resultado en el proceso de diseño inverso, a menudo se limitan a un pequeño conjunto de resultados de materiales fijos44,67.
La selección de materiales juega un papel fundamental en el diseño de emisores selectivos ya que la interacción de la luz con la superficie está regulada por las propiedades espectrales del material70. Si una microestructura o material no es capaz de regular ciertas longitudes de onda, un diseñador puede recubrir material(es) adicional(es) para mejorar la respuesta de banda ancha17,31,32,71, crear un nuevo material compuesto11,12 o seleccionar un nuevo material como base para patrones. Por lo tanto, es fundamental poder buscar exhaustivamente en el espacio material disponible para proporcionar la mejor coincidencia para un conjunto determinado de criterios de diseño térmico72. Para ser exhaustivo en el enfoque de diseño inverso, la salida del material no puede ser fija y debe ser flexible para permitir el descubrimiento de combinaciones únicas de propiedades de materiales con propiedades geométricas.
En este trabajo, proponemos un método de diseño microestructural inverso basado en una red neuronal en tándem construida para tomar un conjunto de propiedades ópticas deseadas y generar un conjunto de propiedades geométricas y materiales. Complementamos la red neuronal en tándem, que consta de una red sustituta y una red inversa, con métodos de posprocesamiento para permitir que la red agregada tenga en cuenta las limitaciones críticas del diseño físico. La red agregada está diseñada en un ciclo de proceso de estilo contradictorio para facilitar que el modelo itere y se desarrolle a sí mismo durante las generaciones posteriores y considere la retroalimentación enfocada de los puntos de control de procesamiento posterior. La base de nuestro método se basa en un sustituto de simulación óptica desarrollado previamente basado en una red neuronal profunda (DNN)72. A diferencia de muchos otros estudios que brindan un enfoque de aprendizaje profundo a la óptica donde se simula un solo material73, los materiales son fijos41 o están codificados en caliente44, nuestro método sustituto no restringe la entrada de material y puede extrapolar para hacer predicciones para materiales que no se usaron en el entrenamiento. La flexibilidad proporcionada por este método nos permite construir una estructura de red neuronal inversa para trabajar en conjunto con el sustituto que tampoco está restringido por la clasificación de materiales. Nuestra estructura de red inversa es capaz no solo de predecir un material óptimo para una entrada deseada determinada, sino también de extrapolar propiedades de nuevos materiales para que coincidan con una entrada deseada determinada.
El modelo que demostramos toma una entrada simple de propiedades ópticas en un rango de longitud de onda y genera un material y una geometría de micropirámide que se adaptan mejor. Se utilizan múltiples métodos de aprendizaje profundo en la construcción del método. Comparamos el sustituto de la red neuronal profunda previamente establecido con un sustituto basado en imágenes e incorporamos la funcionalidad de red neuronal recurrente para mejorar el rendimiento de predicción de la red inversa. Si bien demostramos una optimización limitada con el sustituto72, la red inversa permite una optimización mucho más rápida, dinámica y global. La salida de la red neuronal inversa se somete a una etapa de posprocesamiento en la que se utilizan restricciones geométricas y materiales establecidas por el usuario para producir soluciones adecuadas. Las nuevas propiedades del material generado se comparan con un material de una biblioteca, se simula la salida restringida y los resultados se incorporan a la red sustituta. Con este proceso, podemos optimizar rápidamente una combinación de material y geometría para un espectro óptico deseado en un proceso que sería demasiado costoso desde el punto de vista computacional para realizarlo de otra manera. Si bien aplicamos nuestra metodología a las estructuras de micropirámides, el enfoque que demostramos se puede modificar para adaptarse a cualquier cantidad de topologías de superficie microestructural.
La figura 1 proporciona un esquema completo del marco de la red neuronal agregada. Dividimos el marco en cuatro subcategorías principales: simulaciones FDTD, red sustituta, red neuronal inversa y posprocesamiento. Como se visualiza en la Fig. 1, el flujo general del proceso es que las simulaciones FDTD se usan para entrenar la red neuronal sustituta y la sustituta se usa para hacer predicciones a gran escala derivadas de una biblioteca de materiales. Luego, las predicciones se utilizan para entrenar un componente de red neuronal inversa. La entrada de la red inversa es un espectro óptico deseado (λ, ε, R, T) y la salida es el tramo base de la micropirámide previsto, la altura, el grosor del sustrato (Xspan, Zspan y tsub) y un vector de índice de refracción complejo. valores (n(λ), k(λ)) que corresponden a la longitud de onda de entrada. El módulo de posprocesamiento luego interpreta la salida. Aquí, las restricciones del usuario, como la relación de aspecto máxima, se utilizan para ajustar la salida prevista y proporcionar nuevas soluciones adecuadas que satisfagan las restricciones. Las soluciones ajustadas luego se pasan a través de FDTD y el modelo sustituto. Con base en dos métricas, el error entre la entrada deseada y la salida restringida, y el error entre el suplente y las salidas FDTD, se toma la decisión de volver a entrenar al suplente con los nuevos datos de simulación o detener el ciclo si la solución es se considera suficiente y precisa. Cualquier detalle no discutido en ninguna de las subcategorías principales para todos los módulos y conexiones se puede encontrar en la sección de métodos, los materiales complementarios o en el repositorio de código vinculado.
Representación en diagrama de flujo de la metodología de red neuronal agregada y la arquitectura de red inversa. Las soluciones generadas en la solución sustituta (directa) se utilizan para entrenar el solucionador inverso. La entrada a la red neuronal inversa es un vector de longitud de onda de 400 × 1 y la emisividad, reflectividad y transmisividad dependientes de la longitud de onda. La salida de la red neuronal inversa es un conjunto de propiedades materiales que corresponden a la longitud de onda de entrada y las propiedades geométricas. La salida se evalúa en FDTD y si los resultados violan las restricciones establecidas por el usuario, se calculan soluciones alternativas que se encuentran dentro de las restricciones establecidas.
Las soluciones que utilizan el método FDTD, si bien son precisas, pueden requerir mucho tiempo; esto es especialmente cierto para estructuras grandes o geométricamente complejas. Para este trabajo, los datos de entrenamiento, validación y prueba utilizados por la red neuronal sustituta se compilan a partir de simulaciones completadas en el solucionador FDTD 2D/3D disponible comercialmente de Lumerical. El marco de simulación proporciona soluciones exactas para las ecuaciones de Maxwell a través de una malla de elementos finitos, y la absorción y la dispersión se derivan de los campos eléctricos resultantes28,74. En lugar de simular una microestructura piramidal tridimensional (3D), simulamos la sección transversal media en 2 dimensiones (2D) para minimizar el tiempo de simulación y permitir la generación de grandes cantidades de datos de simulación. Si bien esto conduce a una sobreestimación de la emisividad de la micropirámide20 en comparación con las simulaciones de micropirámide en 3D, los resultados siguen siendo precisos ya que no variamos el ángulo de incidencia en nuestras simulaciones y asumimos que la fuente de longitud de onda de banda ancha está en un ángulo normal con respecto a la superficie del material. . Además, si bien podríamos optar por utilizar un enfoque semianalítico como RCWA para ejecutar las simulaciones75 para estimar las propiedades ópticas de una estructura 2D, la precisión, la escalabilidad y la aplicabilidad de FDTD a otras geometrías más complejas lo convierten en un método viable a largo plazo. solución. Las simulaciones se basan en una geometría de micropirámide visualizada en la Fig. 2, siendo los parámetros geométricos independientes clave el tramo de la base del triángulo (xspan), la altura (zspan) y el grosor del sustrato (tsub). Para este trabajo, asumimos que la ley de Kirchhoff es válida y que la emisividad se puede derivar de α = ε = 1 – R – T, donde la reflectividad (R) y la transmisividad (T) se calculan a partir de los monitores de potencia arriba y abajo y el dominio respectivamente y donde la absorbencia (α) es sinónimo de emisividad (ε)72. Para desarrollar los conjuntos de datos de simulación utilizados para entrenar al sustituto, generamos y simulamos matrices de valores uniformes generados aleatoriamente para xspan, zspan y tsub para cada material incluido. Para simplificar, asumimos que no hay materiales de recubrimiento adicionales, estructuras jerárquicas o rugosidad de la superficie. Se pueden encontrar detalles adicionales sobre nuestra metodología de simulación FDTD tanto en la sección de métodos como en nuestro trabajo anterior2,11,20,32.
(a) Las imágenes para la red neuronal convolucional se formulan utilizando los datos del material dependiente de la longitud de onda. Cada imagen contiene información para un punto de longitud de onda singular. ( b ) Diagrama del proceso de red neuronal convolucional para predecir propiedades ópticas dependientes del material a partir de las imágenes generadas.
Se ha demostrado que los módulos de aprendizaje profundo son excepcionalmente fuertes y versátiles para resolver el llamado problema "hacia adelante"36,52. En este caso, el problema a resolver es la respuesta óptica de una entrada geométrica y material para una superficie de micropirámide periódica uniforme. La intención del diseño de la red neuronal sustituta es actuar como un predictor ultrarrápido y preciso de las propiedades ópticas, de modo que podamos predecir con rapidez y precisión las propiedades ópticas de una gran cantidad de simulaciones. Además, es importante que la red sustituta pueda extrapolar las propiedades ópticas de los materiales más allá de su ámbito de formación original. Como tal, comparamos dos métodos que cumplen esta función: una versión mejorada de una red neuronal profunda previamente desarrollada72 y una red neuronal convolucional profunda basada en imágenes (DCNN). Ambos métodos utilizan conjuntos de datos generados en FDTD que se subdividen en conjuntos de datos de entrenamiento, validación y prueba.
La arquitectura de la red neuronal profunda, visualizada en la Fig. 1 de nuestro trabajo anterior72 y en los materiales complementarios, está diseñada para emular las entradas de simulación críticas que influyen en las propiedades ópticas calculadas. La red emplea un total de 8 neuronas de entrada: 3 entradas geométricas (xspan, zspan, tsub), la longitud de onda de la fuente (λ) y 4 entradas materiales (n, k, εreal, εim). El grosor del sustrato es un parámetro geométrico clave a tener en cuenta, ya que permite que el modelo interprete la relación entre las propiedades ópticas espectrales y el grosor del material subyacente y, en última instancia, prediga el comportamiento espectral de banda ancha de los materiales transmisivos. Las micropirámides de diferentes materiales se diferencian utilizando entradas de material discretas para el índice de refracción complejo (n y k) y los valores de permitividad correlacionados (εreal, εim). En comparación con usar solo n y k, usar tanto el índice de refracción complejo como la permitividad es esencial para extrapolar con precisión las propiedades ópticas de los materiales que no se ven en el proceso de entrenamiento. La longitud de onda (o frecuencia) de la fuente es el factor fundamental que vincula las entradas geométricas y materiales. Para cada simulación FDTD, simulamos 100 puntos de longitud de onda (100 puntos de frecuencia), cada uno de los cuales tiene una solución discreta para reflectividad y transmisividad. En consecuencia, cada simulación se divide en 100 vectores de entrada discretos, ya que la solución de las ecuaciones de Maxwell no depende secuencialmente. Para fortalecer la conexión entre las propiedades ópticas de entrada y salida (R, T) y el parámetro independiente clave (λ), utilizamos dos agrupaciones de perceptrones multicapa (MLP) más pequeñas para considerar por separado la relación entre la geometría/longitud de onda y la datos materiales/longitud de onda. Las salidas de los MLP se concatenan y se alimentan a una red neuronal profunda más grande, cuya salida es un valor de reflectividad y transmisividad.
El método DNN es efectivo tanto para predecir rápidamente como para hacer predicciones precisas, incluso cuando se extrapola. La red neuronal sustituta de DNN tiene un error absoluto medio (MAE) y un error cuadrático medio (MSE) entre los datos de simulación y las predicciones de 0,0033 y 1,35e-4 respectivamente para el conjunto de datos de "prueba", datos que se retienen del entrenamiento /proceso de validacion. Como el diseño de la red no está limitado por restricciones en la entrada de materiales, una evaluación fundamental del desempeño del sustituto está en la predicción de las propiedades ópticas de las microestructuras hechas de materiales que están fuera del alcance del entrenamiento. Por lo tanto, evaluamos la red en dos grandes conjuntos de datos "invisibles" (1500 simulaciones) Al2O3/Ti, y en 100 simulaciones de otros 25 materiales en una "biblioteca". Cuando las simulaciones de estos conjuntos de datos son completamente invisibles para el proceso de capacitación/validación, la DNN genera un MAE entre la predicción y la simulación de 0,0175, 0,0131 y 0,0279 para los conjuntos de datos de Ti, Al2O3 y la biblioteca de materiales, respectivamente. Como las propiedades ópticas ya están en una escala de 0 a 1, estos errores indican un grado excepcional de precisión de predicción cuando se extrapola para nuevos materiales. Para mejorar la precisión de la predicción al extrapolar, el modelo se beneficia de pequeños conjuntos de datos de "calibración". Al incluir de 5 a 10 simulaciones de los conjuntos de datos "no vistos" (< 1 %) en el proceso de capacitación/validación del sustituto, reducimos la predicción MAE a 0,0073, 0,0049 y 0,0118 para los conjuntos de datos de Ti, Al2O3 y biblioteca de materiales, respectivamente. . Las simulaciones incluidas representan un número casi insignificante de simulaciones en comparación con el conjunto de datos de entrenamiento y validación original (< 0,05 %). A pesar de esto, la inclusión tiene un impacto dramático en el resto de los datos extrapolados, lo que indica que el modelo tiene una sólida comprensión física y solo se necesitan varias simulaciones para "calibrar" el modelo al nuevo comportamiento del material. Además de la precisión observada, el modelo puede hacer predicciones extremadamente rápidas, con más de 1 millón de conjuntos de entradas individuales por minuto.
La arquitectura de un segundo método sustituto propuesto basado en el procesamiento de imágenes se muestra en la Fig. 2. Aquí, mejoramos nuestra filosofía de diseño de red neuronal de imitar el solucionador óptico FDTD creando una red que analiza una pseudo-malla. En FDTD, la solución óptica para una combinación dada de material y geometría se deriva de resolver las ecuaciones de Maxwell a través de una malla discretizada76. La única forma en que el modelo puede diferenciar entre dos materiales distintos (p. ej., el aire y la pirámide) es asignando las propiedades del material dependientes de λ a cada celda. Aquí, aproximamos ese proceso generando una imagen que utiliza el material espectralmente dependiente y la información geométrica.
Una imagen es efectivamente solo un tensor: como se muestra en la Fig. 2, tomamos una matriz tridimensional de información material y la traducimos a una imagen RGB estándar, con cada píxel que contiene un vector de datos materiales. Si bien el proceso convolucional es compatible con tensores de orden superior o inferior, para facilitar el uso y simplificar el almacenamiento de datos/el generador de imágenes, utilizamos una imagen en color estándar de 3 canales. El vector utilizado para generar cada imagen es el mismo vector de 8 entradas descrito en la sección anterior, con dos propiedades de material de fondo estáticas adicionales (nbkg = 1 y kbkg = 0). Dado que el máximo Xspan y Zspan en las simulaciones se fijan en un máximo de 10 μm, cada imagen se establece en 10 × 10 μm efectivos, con la resolución de píxeles vertical y horizontal que define la longitud de la "celda". Para minimizar el consumo de memoria, empleamos una configuración de 256 × 256 píxeles. Esto significa efectivamente que cada píxel representa ~ 40 nm, lo que indica que el tamaño mínimo de función que podemos representar de manera efectiva es ~ 40 nm. Por lo tanto, eliminamos cualquier simulación con un tamaño de base de pirámide o una altura inferior a 40 nm. Como se visualiza en la Fig. 2, construimos pirámides simétricamente alrededor del centro de la imagen, llenando el resto del espacio simétricamente hasta que la luz combinada de la base de la pirámide sea de 10 um. Como ejemplo, una pirámide con una base de 10 um llenará perfectamente el eje horizontal inferior de la imagen. Una pirámide con un tramo de base de 1 um se replicará un total de 10 veces en la imagen.
Dos conjuntos de entradas La arquitectura CDNN evalúa dos entradas: la imagen generada y el vector de 8 entradas de información geométrica, de material y de longitud de onda. El componente de la imagen es interpretado por una red neuronal convolucional. La red neuronal convolucional se compone de varias "unidades": cada "unidad" contiene una capa convolucional con una función de activación de ReLU (definida por la Ec. 1) seguida de una capa de agrupación máxima.
Después de varias convoluciones con diferentes configuraciones de filtro, aplanamos la salida y aplicamos una caída antes de una capa densa para limitar el sobreajuste. El segundo componente, el vector de 8 entradas, se utiliza como entrada a una red neuronal profunda. Este vector de entrada contiene detalles que no pueden estar en la imagen, como el grosor y las propiedades del material excluido, o información presente en la imagen, como la información del material y la geometría para reforzar el rendimiento de interpretación y predicción del modelo. La salida de este DNN se concatena con la salida de la CNN y luego pasa a través de un conjunto final de densas capas ocultas. La salida del modelo es la misma que la salida de la DNN: el valor de reflexión y transmisión. Los detalles precisos del diseño de la red se encuentran en la sección de métodos.
Este método sustituto es más efectivo para extrapolar con precisión las propiedades ópticas de nuevos materiales en comparación con el método sustituto DNN únicamente. Cuando solo se utiliza el 20 % de los datos de simulación disponibles en el proceso de capacitación/validación/prueba, podemos igualar o superar el rendimiento de la DNN. El rendimiento preciso depende de la selección de las propiedades del material utilizado en las tres dimensiones de matriz de píxeles disponibles. Si bien la selección de las primeras dimensiones de dos píxeles (el índice de refracción complejo) es sencilla, la tercera cantidad fue un punto de estudio. En la Tabla 1, mostramos el rendimiento de la arquitectura CDNN en la predicción de conjuntos de datos de Ti, Al2O3 y biblioteca de materiales cuando se utilizan diferentes cantidades en la tercera dimensión de la matriz. Con base en estos resultados, observamos que la longitud de onda es el parámetro más efectivo para usar en la tercera dimensión. Esto proporciona una confirmación adicional de que la longitud de onda es un parámetro extremadamente importante para permitir que el modelo construya conexiones adecuadas entre la entrada y la salida. Las evaluaciones del modelo que se muestran en la Tabla 1 se realizan con los conjuntos de datos ocultos completos, aplicamos la limitación del 20 % solo a los datos de entrenamiento del modelo.
Cuando permitimos que el modelo vea el conjunto de datos de simulación completo en el entrenamiento que hace DNN (3,55 vectores de entrada o 3,55 millones de imágenes tomadas de 35 500 simulaciones), el método CDNN supera significativamente al método DNN. Los conjuntos de datos de Ti, Al2O3 y biblioteca tienen un MAE evaluado de 0.0155, 0.0113 y 0.0226 respectivamente. Cuando calibramos el modelo con 10 simulaciones como se demostró anteriormente en el DNN, esto disminuye a 0.0067, 0.0043 y 0.0098 respectivamente. A pesar de ser más precisa que la DNN, debido al aumento relativo de los parámetros y la escala de memoria, el tiempo de entrenamiento y el tiempo de predicción de la CDNN son significativamente más largos que los de la DNN.
Aprovechamos las capacidades de predicción rápida de la red sustituta para entrenar iterativamente una red neuronal que resuelve el problema de diseño inverso. Es decir, invertimos el problema directo para predecir qué material y geometría de la microestructura se adaptarán mejor a la respuesta óptica del sistema deseado. La entrada de esta red es la reflectividad, la transmisividad y la emisividad dependientes del espectro correspondientes a un rango de longitud de onda deseado.
La arquitectura de la red neuronal inversa, como se muestra en la Fig. 1, resuelve el problema inverso considerando toda la distribución espectral. La entrada de la red (400 × 1) es una combinación apilada verticalmente de la reflectividad prevista, la transmisividad, la emisividad derivada (ε = 1 – R – T) y el vector de longitud de onda al que se secuencian las propiedades ópticas. En consecuencia, la salida de la red inversa es una combinación apilada verticalmente de la entrada geométrica y las propiedades del material dependiente de la longitud de onda (n, k, εreal, εim, 403 × 1) como se muestra en la Fig. 1. A diferencia de la red sustituta, no podemos separar las entradas de una red inversa en vectores de entrada individuales. Una solución "invertida" para un solo conjunto de propiedades ópticas dependientes de la longitud de onda tiene un número ilimitado de soluciones potenciales, por lo que para diseñar una red invertida efectiva, la entrada debe ser la secuencia completa. En nuestras primeras iteraciones de diseño del sustituto de la red neuronal profunda, consideramos usar la secuencia completa de longitudes de onda/datos materiales como entrada y reflectividad/transmisividad como salida. Si bien este método fue efectivo, debido a que las ecuaciones de campo de Maxwell no dependen secuencialmente, el solucionador sustituto fue mucho más efectivo cuando las secuencias se dividieron y se usaron como entrada vectores individuales basados en un solo punto de longitud de onda. Este método también amplía drásticamente el alcance del conjunto de entrenamiento de 35 500 simulaciones a 3,55 millones de conjuntos de entrada, lo que hace que un número limitado de simulaciones sea más efectivo para desarrollar un sustituto con conocimiento físico que pueda resolver el problema directo con mayor precisión. Sin embargo, una vez que el sustituto está capacitado y puede producir resultados precisos, la cantidad de simulaciones se vuelve trivial, ya que podemos estimar efectivamente las soluciones a 10,000 simulaciones FDTD (con 100 puntos de longitud de onda cada una) en aproximadamente 60 s utilizando la red de sustitutos.
Para generar datos de entrenamiento para la red neuronal inversa, pasamos grandes cuadrículas de datos a la red sustituta para la predicción y recopilamos la salida en conjuntos discretos de entrada y salida. Para cada material de una biblioteca, generamos una cuadrícula de 200 × 200 combinaciones geométricas. Estas combinaciones se forman mediante la malla de vectores espaciados linealmente para Xspan y Zspan. Los valores mínimo y máximo para estos vectores se basan en el valor mínimo y máximo observado de Xspan y Zspan en el conjunto de datos de entrenamiento del sustituto. En total, la cuadrícula tiene 40.000 combinaciones geométricas (o 40.000 simulaciones) para un solo material. Para cada combinación geométrica, adjuntamos un vector de longitud de onda de longitud 100, lo que lleva a una suma de 4 millones de entradas por material que se pasan al sustituto. Si bien el vector de longitud de onda adjunto a cada combinación geométrica era originalmente un vector espaciado linealmente que oscilaba entre λ = 0,3 um y λ = 16 um, descubrimos que el uso de un vector de longitud de onda espaciado linealmente con valores mín./máx. aleatorios para cada combinación geométrica aumentaba la versatilidad. del conjunto de datos de entrenamiento y, por lo tanto, aumentó la robustez de la red neuronal inversa. Todos los datos de cuadrícula generados se normalizan antes de pasar a la red sustituta para la predicción. El parámetro final no material, el grosor del sustrato, también se aleatoriza a través de un proceso uniforme de generación aleatoria. Los detalles sobre el proceso de generación aleatoria para el grosor del sustrato y el vector de longitud de onda se pueden encontrar en la sección de métodos. Este proceso de generación de cuadrículas se repite en todos los materiales de una biblioteca de materiales. La biblioteca de materiales contiene 50 materiales: una lista de los materiales y sus referencias se proporcionan en el documento complementario. El número de materiales en la biblioteca es fácilmente escalable y son una representación no exhaustiva de las propiedades de los materiales disponibles para una microestructura. En total, utilizamos la red sustituta para estimar 2 millones de simulaciones o 200 millones de conjuntos de entradas. Luego secuenciamos las propiedades ópticas predichas usando el vector de longitud de onda (de longitud 100) para cada simulación.
La red inversa contiene tres componentes distintos de red neuronal que están diseñados para funcionar en conjunto para extrapolar una geometría y un material que se ajuste mejor a la respuesta óptica deseada. El primero de los componentes es una red neuronal profunda que consta de múltiples capas ocultas que toman directamente el vector de entrada (400 × 1). En un nivel rudimentario, simplemente invertir la estructura DNN del sustituto, pero con la progresión de longitudes de onda en lugar de un punto de longitud de onda individual, podría ser efectivo. Sin embargo, a través de nuestro proceso de desarrollo, descubrimos que este enfoque más simple carecía de conocimiento físico y, a menudo, resultaba en un resultado no viable físicamente. Aunque las soluciones a las ecuaciones de Maxwell para una determinada longitud de onda, material y geometría (el problema que aborda la red directa) no dependen secuencialmente, los cambios abruptos o las singularidades en las propiedades del material en un espectro son raros. Por lo tanto, desarrollar conocimientos sobre la relación entre una secuencia de entradas ópticas y las propiedades del material es crucial para construir un modelo físicamente fundamentado. Para abordar esto, reasignamos la secuencia lineal de propiedades ópticas en una matriz dependiente del "tiempo" y la usamos como entrada para una red neuronal recurrente (RNN). Es decir, mapeamos el vector de 400 × 1 de (λ, ε, R, T) en una matriz de 1 × 100 × 4 (λ, ε(λ), R(λ), T(λ)). Seleccionamos capas bidireccionales de memoria a largo y corto plazo (LSTM) como componente constituyente de la RNN. Las redes LSTM son más efectivas que otros métodos RNN para dependencias de largo alcance en datos77, y los atributos bidireccionales permiten que la red aprenda ambas dependencias en la dirección directa e inversa. Además, utilizamos capas de abandono entre las capas LSTM junto con la regularización L2 para reducir el sobreajuste. Las salidas de los componentes RNN y DNN luego se combinan mediante una multiplicación de matriz y se alimentan a un tercer componente, otro DNN. A diferencia de vincular directamente la salida de la red a las capas finales de DNN/RNN, una DNN entre estas dos redes y la salida de la red final facilita una capa adicional de abstracción no lineal y aprendizaje de las salidas de los dos componentes de red neuronal anteriores.
La Figura 3 muestra la salida de la red neuronal inversa para varias entradas de prueba de banda ancha y los resultados una vez que las salidas de la red se simulan en FDTD. Utilizamos tres espectros de prueba térmicamente relevantes como evaluador de referencia de la red inversa: emisividad unitaria, un espectro de emisión de calefacción ideal y un espectro de refrigeración ideal. Estos espectros de emisión se muestran en la Fig. 3g–i. Para estos casos de prueba, establecemos la transmisión espectral en 0 y R = 1 – ε. En la Fig. 3a–c comparamos las propiedades del material predichas por la red neuronal con las propiedades del material de la biblioteca que mejor se adapta. Las condiciones geométricas predichas se dan en la Tabla 2. Para todos los casos, las propiedades del material proyectado tienen una coincidencia cercana en la biblioteca. En la Fig. 3d-e comparamos los resultados de las simulaciones FDTD utilizando el material generado en la red y el material de coincidencia más cercano para la misma geometría óptima predicha. Tanto para el caso de calentamiento como para el de unidad, observamos que el material generado por la red neuronal supera al material de la biblioteca. Además, observamos que tanto el material generado como el material de la biblioteca producen un resultado que coincide con la entrada deseada con un alto grado de precisión. Esto es a pesar de que la entrada tiene un comportamiento de función de paso no físico. El espectro de enfriamiento ideal (Fig. 3i) tiene una desviación mayor entre el espectro deseado y el resultado real tanto para el ML como para los materiales generados por la biblioteca. El error observado se atribuye a la limitación física de las propiedades del material y la imposición de transmisión espectral cero. Esta suposición está fuera de la intuición física habitual para el caso de enfriamiento ideal, donde debido a las limitaciones del material físico, la mayoría de los materiales emisivos (por ejemplo, TiO2, Al2O3, PDMS, etc.) en el infrarrojo son transmisivos en el ultravioleta (UV) a NIR. longitudes de onda Por lo tanto, esto representa un desafío de diseño para que un solo material realice ambas funciones, y la red neuronal inversa intenta abstraer un material físicamente limitado que se ajuste a la transmisión espectral cero. Las propiedades identificadas coinciden bien en el espectro más amplio, pero no capturan el rendimiento previsto en las regiones del visible al infrarrojo cercano (λ = 0–4 um). Si permitimos la transmisión en esta región, recibimos un resultado esperado de PDMS, cuyos detalles se pueden encontrar en el documento complementario.
(a–c) Espectros de emisividad de tres casos de prueba (calentamiento ideal, enfriamiento ideal y emisividad unitaria) ingresados en el espectro inverso. La reflectividad se calcula como R = 1 – E, y la transmisividad se establece en 0. (d–f) Índice de refracción generado por ML (n) y coeficiente de extinción (k) para cada uno de los casos de prueba en comparación con las propiedades materiales de un material en la biblioteca que más se acerque a ella. (g–i) Resultados de la simulación FDTD tanto para el material generado por ML como para el material de la biblioteca más cercano.
La red neuronal inversa no se limita al diseño de banda ancha. En la Fig. 4, mostramos cómo se puede aplicar la red neuronal inversa al diseño de microestructuras de banda estrecha. En este caso, definimos la banda estrecha como 2 puntos de emisividad con un valor unitario alrededor del pico de longitud de onda previsto. Los resultados de la red neuronal inversa para 6 puntos de longitud de onda diferentes (1, 2, 3, 4, 5 y 15 um) se muestran en la Fig. 4a-f. El resultado del diseño destaca tanto las fortalezas como las debilidades de la metodología de red neuronal inversa presentada. El espacio de diseño geométrico está limitado a la geometría de micropirámide relativamente simple y solo puede utilizar un material. Por lo tanto, con la arquitectura de red neuronal implementada, nuestro modelo se mantiene dentro del comportamiento material físico y restringido, intentando encontrar soluciones válidas sin crear un material completamente arbitrario. Esto conduce a soluciones válidas de banda estrecha en las regiones de baja longitud de onda donde la geometría se puede atenuar para generar resonancia plasmónica y comportamiento resonante. Este comportamiento es particularmente evidente en las soluciones visualizadas en la Fig. 4c, d, con picos en o cerca de la ubicación deseada, aunque con un rendimiento reducido o picos más allá de la ubicación deseada. La red neuronal puede identificar fácilmente soluciones que son físicamente factibles, pero tiene el desafío de encontrar un comportamiento resonante que resulte en soluciones de banda estrecha para las longitudes de onda del infrarrojo medio. Estos gráficos resultan de las limitaciones físicas impuestas por la entrada, los datos de entrenamiento disponibles para la red y la física fundamental del sistema de micropirámide. A pesar de estos desafíos, todavía se puede demostrar que la red inversa identifica el comportamiento físico fuera del alcance de sus datos de entrenamiento. En la Fig. 4d, las predicciones del modelo sustituto no indican un comportamiento de banda estrecha resonante a 4 um, pero cuando se simula, la salida de la red neuronal inversa muestra un grado significativo de rendimiento de banda estrecha. Esto indica que la red neuronal inversa puede abstraer soluciones más allá de los datos de entrenamiento e identificar comportamientos que el sustituto no puede, pero la red aún está restringida por la física fundamental.
( a – f ) Resultados de la simulación de banda estrecha utilizando la red neuronal inversa. El espectro de entrada tiene una emisividad de 0,05 en todo el λ = 0,3 a 16 um, excepto en dos puntos que definen la ubicación del "pico" que tienen una emisividad de 1. La reflectividad se define por E = 1 – R y la transmisión se establece a 0. Los resultados se comparan con la entrada deseada, así como con las predicciones sustitutas para el mismo material.
Si bien la salida de la red neuronal inversa puede predecir con precisión las propiedades geométricas y materiales que dan como resultado el espectro óptico deseado, una limitación clave de nuestra arquitectura de red neuronal abierta es que no puede adaptarse directamente a las restricciones de diseño. Esto presenta un desafío significativo para hacer que el proceso de diseño inverso sea funcional. Idealmente, nuestra red agregada generará una solución que se puede traducir a una morfología de superficie fabricada. Este desafío es evidente a partir de los resultados geométricos para el caso de calefacción ideal en la Tabla 2; la relación de aspecto de la estructura predicha de ML es ~ 400 (Zspan/Xspan), que es claramente una microestructura poco práctica. Para abordar esto, tomamos la salida de la red neuronal y usamos una metodología de procesamiento posterior para brindar nuevas soluciones que se ajusten a las restricciones establecidas por el usuario. Aunque es posible restringir la propia red neuronal a través de métodos como funciones de activación personalizadas en las neuronas de salida, limitar el conjunto de datos de entrada o introducir límites en la entrada, elegimos posprocesar la salida de la red neuronal para mantener un solucionador inverso robusto. . Para este trabajo, nos enfocamos en restringir la relación de aspecto, ya que juega un papel clave para determinar si una microestructura es fabricable. Otras restricciones, como la temperatura máxima de un material, las limitaciones de espesor, etc., son importantes y se pueden incorporar fácilmente para una optimización de diseño más avanzada.
La metodología de posprocesamiento tiene varias etapas: predicción inversa, coincidencia de materiales, ajuste geométrico, predicción sustituta, simulación y, finalmente, comparación de resultados. Los detalles precisos para todas las etapas del método de posprocesamiento se proporcionan en la sección de métodos. La primera etapa es tomar un espectro óptico, pasarlo a través de la red inversa y generar un conjunto de propiedades geométricas e información del material espectral. A partir de ahí, los datos de material generados por ML se comparan con los materiales existentes en la biblioteca de materiales. Luego ajustamos la geometría generada por ML para alinearla con la relación de aspecto máxima establecida. Usando la geometría ajustada, seleccionamos aleatoriamente nuevas geometrías restringidas/viables y las simulamos usando el sustituto; las soluciones más óptimas se pasan a FDTD. El método de posprocesamiento luego compara el FDTD de "verdad en tierra" tanto con la salida sustituta como con la entrada deseada. Este proceso se realiza tanto para el material generado por ML como para el material de biblioteca de "mejor ajuste" e identifica una geometría restringida que es óptima tanto para el material generado por ML como para el material de biblioteca seleccionado.
La Figura 5a,b muestra la aplicación del método de posprocesamiento para seleccionar una nueva solución viable para el caso de calefacción ideal discutido anteriormente. Para esta demostración, mostramos soluciones cuando la relación de aspecto (Z/X) está limitada a 10, 5 y 1. Las nuevas soluciones geométricas se simulan utilizando el sustituto y los resultados se comparan con las predicciones para la geometría generada por ML sin restricciones. . En comparación con el espectro de entrada deseado, los casos restringidos tienen un valor LSE de 1,229, 1,396 y 1,567 para AR = 10, 5 y 1 respectivamente. Es evidente que mientras los resultados disminuyen en la adherencia al espectro deseado a medida que la relación de aspecto es limitada, también es evidente en la Fig. 5c que los ajustes a la geometría para acomodar la restricción de la relación de aspecto limitada todavía producen resultados altamente óptimos. Es evidente que estas soluciones se desvían del máximo global, pero siguen siendo muy eficaces cuando están limitadas. Si se considera que la solución restringida no es lo suficientemente viable, se pueden incluir materiales adicionales en la búsqueda, formando un algoritmo de comparación de materiales más avanzado que el utilizado anteriormente20,72.
(a) Ejemplo de reorientación vertical y (b) horizontal de la salida de ML inversa y la posterior generación de puntos de solución distribuidos aleatoriamente sobre la solución geométrica ajustada. El ejemplo que se muestra utiliza una limitación de relación de aspecto de 5. Estas soluciones se evalúan utilizando tanto FDTD como el sustituto, la nueva solución más óptima es utilizando un proceso descrito en la sección de métodos. (c) El punto óptimo identificado en cada relación de aspecto se muestra para cada relación de aspecto. Si bien la solución no es tan óptima como la geometría original generada por ML, aún podemos identificar diseños geométricos con un rendimiento excepcional.
Al combinar los componentes individuales, formamos el ciclo del sistema agregado visualizado en la Fig. 1. El sistema agregado está diseñado de manera que pueda aprender de los errores anteriores y mejorar sus capacidades y precisión en las generaciones posteriores. A pesar de la precisión del sustituto basado en imágenes, especialmente para materiales invisibles, el tiempo requerido para entrenar y volver a entrenar la red convolucional basada en imágenes en comparación con el sustituto de red neuronal profunda más simple lo elimina como una opción para el sistema agregado. Los datos de cuadrícula de simulación geométrica/de longitud de onda generados para cada material se pasan al sustituto de DNN y las predicciones resultantes son la base de los datos de entrenamiento de red inversa. Si se realizan cambios en el sustituto o se incluyen más materiales en la biblioteca, se regenerarán los datos de la cuadrícula. Luego empleamos los casos de prueba de banda ancha y banda estrecha en las Figs. 3 y 4 para probar el rendimiento de la red inversa al hacer predicciones. Si se encuentran desviaciones significativas entre el resultado deseado y el resultado real o si la predicción sustituta se desvía significativamente de los resultados de FDTD, realizamos simulaciones adicionales a través de nuestro método de generación de soluciones de posprocesamiento. Estos resultados se incorporan en los datos de entrenamiento para el suplente, y la red sustituta/inversa se vuelve a entrenar. Luego, el procesamiento posterior cumple una función adicional como un punto de control pseudo-adversario donde los resultados generados se comparan con los resultados reales y, si hay un resultado no deseado, la red se vuelve a entrenar con nueva información de simulación.
Un desafío central que enfrenta el diseño de microestructuras es el tiempo requerido para simular y optimizar un diseño. Para el primer componente, en marcado contraste con un solucionador FDTD, una red neuronal puede hacer predicciones comparativamente instantáneas. La generación de ~ 40 000 simulaciones FDTD utilizadas para entrenar, probar y evaluar nuestra red sustituta requirió meses de tiempo computacional, mientras que la red sustituta puede predecir una cuadrícula de 40 000 simulaciones (4 millones de conjuntos) en aproximadamente 4 a 5 minutos. La red sustituta DNN puede predecir una simulación de 100 puntos de longitud de onda en aproximadamente 6 ms, lo que representa un aumento de velocidad de 4 a 6 órdenes de magnitud en comparación con el uso del solucionador FDTD para la misma tarea. Teniendo en cuenta la precisión demostrada de la red en una biblioteca de materiales, este método es muy eficaz para reducir sustancialmente la necesidad de complejos solucionadores ópticos para estimar las propiedades ópticas espectrales en una gran biblioteca de materiales. Como se demostró anteriormente, una vez que el modelo tiene una conexión con la física del problema, se requieren muy pocas simulaciones para "calibrar" el modelo a nuevos materiales. Nuestro sustituto DNN solo requiere que se incluya un promedio de 5 a 20 simulaciones FDTD en el entrenamiento por material para acercar el error de predicción de ese material al resto del conjunto de datos.
Una ventaja fundamental de la red sustituta en comparación con las simulaciones FDTD (la velocidad) se aprovecha en este trabajo para crear un conjunto de datos integral para entrenar un solucionador inverso que tiene como objetivo abordar los desafíos clave en la optimización del diseño. En nuestras publicaciones anteriores, abordamos la optimización utilizando una figura térmica de mérito y un método de optimización de "fuerza bruta". Es decir, diseñamos una función objetivo para describir un espectro deseado y usamos el FDTD o la salida óptica sustituta para resolver las ecuaciones térmicas y luego usamos la función objetivo para determinar qué espectro coincide de manera más óptima con la entrada. Este método, claramente, es increíblemente lento y engorroso. El uso de una red neuronal para realizar la tarea inversa, al igual que la red de resolución directa, es mucho más rápido que este enfoque. La diferencia de velocidad se basa en el hecho de que la red neuronal inversa puede aprender el patrón entre las propiedades ópticas y las propiedades geométricas/materiales, y tomar directamente un espectro y generar un material/geometría que se adapte a él. En lugar de una metodología indirecta que se basa en identificar el mejor espectro utilizando cuadrículas de datos generados por sustitutos a través de múltiples materiales, la red inversa entrena en esas cuadrículas y proporciona al usuario una salida casi instantánea a un espectro seleccionado. Este método también abre la puerta a soluciones no intuitivas, ya que potencialmente podemos identificar nuevos materiales que no están en la biblioteca de materiales.
Determinar el método sustituto apropiado para generar los datos de entrenamiento para los datos inversos es una consideración importante en el diseño del sistema agregado. En última instancia, debido a las grandes cuadrículas de datos que se utilizan para generar los datos de entrenamiento y el proceso de entrenamiento/reentrenamiento, la red inversa necesita un sustituto rápido. La metodología DNN, en comparación con la CNN, es significativamente más rápida en la realización de predicciones y en el entrenamiento. Cuando se entrena en el conjunto de datos completo, el enfoque basado en imágenes puede requerir cientos de horas para entrenarse utilizando nuestros recursos computacionales. Comparativamente, la DNN puede entrenarse en todo el conjunto de datos en aproximadamente 25 a 50 h. Además, el tiempo de predicción es significativamente más largo para la CDNN, lo que hace que la generación de datos de simulación para entrenar la red inversa sea mucho menos eficiente. Si bien el método CDNN es más preciso, el aumento de precisión incremental que observamos no justifica el costo de tiempo en este caso. Podríamos reducir el tamaño de las imágenes utilizadas por la CDNN para acelerar los tiempos de entrenamiento y predicción de la red, pero entonces perderíamos resolución espacial y tendríamos que eliminar de consideración una mayor cantidad de simulaciones. La eficacia de la CDNN será más evidente en trabajos futuros que se basen en estructuras más complejas. Las imágenes utilizadas como entrada no están vinculadas específicamente a una sola geometría, y se podría construir un sustituto de CDNN que resuelva las propiedades ópticas de diferentes geometrías o incluso formas abstractas. Esto también podría incluir múltiples geometrías, jerarquías o incluso estructuras que incluyen múltiples materiales, como estructuras recubiertas o estructuras compuestas. Además de estas opciones, una CDNN también podría convertirse en un solucionador inverso en tándem con una red generativa. En última instancia, si bien la geometría de micropirámide que mostramos en el presente trabajo es relativamente simple y no requiere el sustituto basado en imágenes para entrenar la red inversa, las posibles opciones futuras para redes neuronales inversas complejas basadas en una "malla derivada de imágenes" son ilimitadas.
La principal fortaleza del diseño de la red neuronal inversa, su capacidad para generar un conjunto único de propiedades espectrales del material, genera importantes desafíos de diseño e implementación. Una preocupación central en el diseño de la red es determinar cómo equilibrar el deseo de permanecer físicamente limitado y, al mismo tiempo, permitir que el modelo encuentre formas de extrapolar de formas nuevas y únicas. Un enfoque simple habría sido simplemente codificar clasificaciones de materiales en caliente, eliminando así las salidas de materiales no físicos. Este enfoque no es deseable ya que no solo elimina la capacidad de extrapolar nuevos materiales, sino que también reduce significativamente la capacidad de explorar diferentes materiales en el procesamiento posterior. Como se demostró, las propiedades del material generado por el modelo pueden superar a los materiales de la biblioteca. A medida que el alcance de la red sustituta e inversa continúa ampliándose, se agregan más materiales y se realizan más simulaciones, esperamos que la red inversa no solo supere cada vez más a los materiales existentes, sino que podría usarse para identificar índices de refracción "efectivos" e informar la ingeniería inversa de combinaciones de materiales que lo igualan. Estas fortalezas se pierden con la clasificación rígida de materiales, y para mantener un solucionador robusto, diseñamos la red para acomodar salidas de materiales que solo están limitadas por la lista arbitraria de materiales utilizados para generar los datos de entrenamiento.
La opción de diseño para permitir que la red elija propiedades de materiales discretos, en lugar de la clasificación, genera desafíos importantes y requiere compromisos de diseño. Las primeras iteraciones del diseño de la red inversa utilizaban un solo DNN con una entrada de un solo vector (400 × 1), pero descubrimos que la salida a menudo no era física ni realista. Por lo tanto, para fundamentar el modelo a partir de la abstracción pura de las propiedades del material, implementamos un método secuencial que utiliza un RNN para garantizar que el modelo pueda aprender las relaciones hacia adelante y hacia atrás de las propiedades del material. Esto permite que el modelo tenga un cierto nivel de conocimiento físico sobre el aspecto general de los materiales, de modo que cuando genera el resultado, el resultado debe parecerse, pero con suerte superar, el rendimiento de la microestructura hecha del material de "mejor coincidencia" en la biblioteca. . Además, la construcción inicial de nuestra red solo consideraba la emisividad como entrada. Sin embargo, en las iteraciones posteriores del modelo, encontramos que la inclusión de los dos parámetros que determinan la emisividad, la reflectividad y la transmisión, permitió no solo un mayor control para el usuario, sino también un refuerzo adicional en la capacidad del modelo para abstraer las relaciones físicas entre el material. propiedades y espectro de entrada.
Una consideración importante es el impacto que tiene la geometría en las propiedades ópticas y, por lo tanto, el rendimiento térmico en comparación con una superficie sin textura. Los materiales generados e identificados a través del proceso de red neuronal se ajustan a la intuición física para cada una de las entradas de prueba. Si bien esta intuición puede ser suficiente para un algoritmo de coincidencia de materiales, la aplicación de una textura optimizada mejora aún más la absorción y mejora el resultado térmico y óptico de un sistema. Esto es particularmente cierto para la entrada de calor ideal que se muestra en la Fig. 3a, donde la textura óptima conduce a una superficie que puede absorber más del 96 % de la radiación solar incidente, en comparación con aproximadamente el 15 % cuando la superficie no tiene textura. Mientras que el grafito sin texturar (completamente liso) de <100 um de espesor tiene una eficiencia de emisión de ~33,5 %, el texturizado óptimo identificado por ML aumenta la eficiencia de emisión a ~99,6 %. La textura tiene un impacto mínimo en el Si3N4, aumentando la eficiencia de emisión de ~ 75,6 a 99,9 %. La derivación y representación gráfica de estos valores se muestra en los materiales de apoyo.
Varias cuestiones clave surgen del diseño de red seleccionado. El primero consiste en identificar y corregir posteriormente los errores cometidos por la red neuronal inversa. Debido al diseño abierto de las salidas de material y la gran variabilidad en las entradas, es muy fácil para un usuario especificar una entrada no física que puede resultar en que la red haga una aproximación válida para gran parte del espectro de banda ancha pero falta una porción estrecha clave del espectro. Esto es particularmente evidente en el caso de banda estrecha que se muestra en la Fig. 4, donde se usa una entrada de longitud de onda de banda ancha grande junto con un espectro no físicamente intuitivo para un microsistema de un solo material. Este desafío de diseño requería cambiar de solo entradas de longitud de onda de banda ancha (0.3–16 um) en los datos de entrenamiento a aleatorizar el vector de longitud de onda/material pasado al sustituto. Aún así, los resultados aún demuestran que el modelo intentará resolver el problema pero, por supuesto, no puede corregir la entrada de un usuario. Debe reconocerse que la red se entrena utilizando resultados secuenciales y limitados físicamente, por lo que no se debe esperar que la abstracción de una solución para lo que podría ser un espectro deseado no físico tenga un alto grado de precisión. Un segundo desafío relacionado proviene de las rutas de datos materiales y los métodos de generación. El método FDTD se basa en datos de ajuste de curva basados en mediciones muestreadas experimentalmente. Nuestra red construye un modelo de ajuste de spline cúbico basado en datos de materiales generados por FDTD. Cuando queremos simular las propiedades del material generado por la red neuronal, debemos pasarlo a FDTD de la misma manera que lo harían las mediciones físicas. Esto puede generar algunos desafíos fundamentales en el ajuste de curvas y la automatización, ya que el ajuste de la curva FDTD para los datos generados por ML puede ser completamente incorrecto y requerir intervención manual. Este proceso también limita nuestras opciones para usar datos generados por ML en el ciclo de entrenamiento del sistema agregado. Si las propiedades reales se desvían de las entradas, la incorporación de los datos podría conducir a imprecisiones de predicción significativas. Para futuros esfuerzos de modelado con sistemas más avanzados y compuestos de múltiples materiales, se requerirá una interpretación e interpolación muy cuidadosas de las propiedades de los materiales para representar y predecir adecuadamente los nuevos materiales.
Otro desafío es restringir la salida según los límites establecidos por el usuario. Las restricciones potencialmente aplicables son abundantes, pero para este trabajo nos enfocamos en restringir la relación de aspecto, ya que es un elemento crucial para determinar la capacidad de fabricación y la escalabilidad de una microestructura. Presentamos una solución a ambos problemas clave mediante la introducción de un módulo de posprocesamiento. Este módulo no es una red neuronal y funciona fuera de la "caja negra" del diseño de redes neuronales y se puede ajustar más fácilmente para dar cuenta de escenarios reales utilizando la salida óptima proporcionada por la red inversa. Una deficiencia aparente del diseño de redes neuronales es comprender la complejidad cada vez mayor de la abstracción no lineal que ocurre dentro de la "caja negra" de las capas ocultas. Si bien podríamos introducir limitaciones en la red, agregar nuevas variables, etc., para tener en cuenta las restricciones, esto puede no solo reducir la solidez de la arquitectura, sino que también podría dificultar complementar o ajustar la solución con conocimiento físico.
En efecto, el módulo de posprocesamiento asume el papel tanto de un punto de control contradictorio como de un método de optimización mínima local. Si se violan las restricciones impuestas, el módulo de posprocesamiento infiere nuevas soluciones y determina cuáles de ellas son las más óptimas. Por supuesto, este método podría usarse de la misma manera de "fuerza bruta" que utilizamos en publicaciones anteriores20,32,72 para determinar una solución óptima mínima local a partir del sustituto, particularmente si se combina con un método de optimización de descenso de gradiente . Sin embargo, esto tiene los mismos problemas que los enfoques anteriores en el sentido de que el resultado no solo es probable que sea un mínimo local, sino que tendríamos que repetir el proceso para cada material de la biblioteca. El sistema agregado está diseñado para aprovechar todos los módulos para aprender y corregir automáticamente las redes si la red sustituta o inversa hace una predicción incorrecta. Al generar nuevas soluciones, simularlas y luego comparar los resultados de la simulación con los resultados sustitutos y la entrada deseada, se puede tomar automáticamente la decisión de incluir los datos de la simulación en un ciclo posterior de generación de datos y entrenamiento del modelo. Este proceso es directamente transferible a cualquier diseño de microsistema y para iteraciones más avanzadas que incluyen parámetros limitantes adicionales, como la dependencia de la temperatura y las propiedades del material dependientes de la temperatura. La naturaleza ilimitada de todo el ciclo también abre perspectivas y soluciones únicas que de otro modo serían inviables.
Hemos demostrado una plataforma que puede producir propiedades geométricas y materiales discretas y únicas que conducirán a un espectro óptico de entrada. Los modelos no están estrictamente restringidos por la clasificación de materiales y la red se puede utilizar para identificar las propiedades de los materiales que resolverían mejor el problema. El solucionador inverso permite el diseño de un algoritmo de coincidencia de materiales que puede identificar qué materiales son los más adecuados para coincidir con una respuesta óptica deseada en función de las restricciones establecidas por el usuario. Además, la entrada de red inversa no se limita a un vector de longitud de onda de entrada preestablecido, lo que permite la exploración dinámica de soluciones de banda estrecha y longitud de onda limitada además de la optimización inversa de banda ancha más tradicional. Como parte de la plataforma, el método de posprocesamiento que se muestra toma la salida de la red neuronal inversa, la elimina de la caja negra del procesamiento de la red neuronal y permite realizar ajustes en la salida de la red neuronal según las restricciones establecidas. La sección de posprocesamiento también sirve como un nodo contradictorio para el sistema combinado, conectándose a la fuente de simulación FDTD e introduciendo datos de simulación específicos para mejorar la red neuronal en las generaciones posteriores. Si bien solo usamos el solucionador sustituto derivado de redes neuronales profundas como parte de este proceso, el método basado en imágenes que desarrollamos podría desempeñar un papel fundamental en futuras iteraciones de redes de diseño inverso para microestructuras más complicadas o sistemas de múltiples materiales que no pueden ser simplemente representado en una red neuronal profunda. Nuestra metodología no solo reemplaza efectivamente las simulaciones FDTD para micropirámides, sino que también permite el diseño inverso y la optimización casi instantáneos, lo que permite optimizaciones de diseño completas y complejas casi instantáneas.
Los conjuntos de datos y modelos generados y/o analizados durante el estudio actual están disponibles en el repositorio Inverse-Optical-Neural-Network, https://github.com/jmsulliv/Optical_Prediction_Reverse_Network.
Realizamos simulaciones FDTD en el software de simulación FDTD comercialmente disponible de Lumerical/ANSYS. La celda unitaria que se muestra en la figura 1 replica las principales variables simuladas: xspan, zspan y tsub. Una fuente de ondas planas con incidencia normal se coloca en la dirección z. Para este trabajo no consideramos la dependencia angular de las propiedades ópticas ni la dependencia de las propiedades ópticas del ángulo de polarización. La longitud de onda de inyección abarca un vector espaciado linealmente de 100 puntos de longitud de onda que comienza con λmin y termina con λmax. Se aplican capas perfectamente adaptadas en la dirección de la fuente de inyección para evitar la reflexión de los límites tanto en la parte superior como en la inferior del dominio y las condiciones de contorno periódicas se colocan perpendiculares a la fuente de la onda. Los monitores de campo y potencia en el dominio de la frecuencia se colocan por encima y por debajo de las capas límite de PML para monitorear la reflexión y la transmisión, respectivamente. La emisividad se calcula utilizando la Ley de Kirchhoff, α = ε = 1 – R – T. Los monitores se resuelven en cada punto de frecuencia/longitud de onda, lo que conduce a una coincidencia uno a uno de la salida de simulación con la fuente de onda.
Para los datos de entrenamiento sustitutos, si bien existen algunas variaciones en las longitudes de onda utilizadas para generar los datos del material72, la mayoría de los materiales se simulan utilizando un λmin/λmax de 0,3/16 μm respectivamente. El dióxido de vanadio se divide en dos materiales separados: el de una fase aislante (comportamiento cerámico) y el de una fase metálica (comportamiento metálico)78. El valor de tsub depende de la selección del material. Para metales (Ni, Al, Ag, W, Sn, Fe, Ta, Cr, Ti) y SiC, simulamos en un rango de valores aleatorios de tsub limitados por un valor mínimo de 1 μm y un máximo de 3 um. Para materiales transmisivos con una amplia gama de rendimiento dependiente del sustrato (p. ej., VO2, SiO2, PDMS, Al2O3), elegimos que el espesor mínimo sea de 1 um y el máximo de 100 μm. Para las simulaciones que ocurren como parte de la fase de posprocesamiento en el bucle de la red agregada, las simulaciones toman directamente en cuenta las propiedades de salida del módulo de posprocesamiento/red neuronal.
Utilizamos una red neuronal profunda con capas densas totalmente conectadas. Nuestro enfoque de aprendizaje profundo se basa en la biblioteca keras de código abierto en python79. La red sustituta, como se publicó anteriormente72, utiliza una DNN optimizada con 8 capas densas completamente conectadas con 400 neuronas por capa, y ambas MLP son 4 capas de 50 neuronas cada una.
La red CDNN combina una estructura DNN similar con una arquitectura CNN. La primera estructura DNN toma el mismo vector de entrada que la red discutida anteriormente, pero usa un conjunto más pequeño de capas y neuronas. La CNN utiliza 6 grupos de convolución – ReLU – max pooling. La configuración de filtro para las capas convolucionales es 64, 128, 256, 512, 512, 512. A la capa convolucional final le sigue una agrupación máxima, abandono (0,25), aplanamiento, densidad, abandono (0,5) y luego un denso final capa. La salida se concatena con la estructura DNN y se alimenta a otra DNN, que son 7 capas densas completamente conectadas con 1024 neuronas cada una. Utilizamos un proceso generador de imágenes personalizado para manejar la importación de imágenes y sus propiedades de red neuronal profunda asociadas en el modelo.
La red inversa toma el mismo conjunto de entradas (vector 1 × 400) y lo aplica de dos maneras separadas. La primera es una entrada directa a una red neuronal profunda, con una forma de entrada de 1 × 400, que consta de 6 capas densas completamente conectadas de 750 neuronas cada una. La segunda entrada transforma el vector original de 1 × 400 en un vector de 1 × 100 × 4 y se coloca en una red neuronal recurrente. La RNN está construida con 3 módulos LSTM bidireccionales, es decir, una capa LSTM bidireccional seguida de una caída (0,5). Cada capa LSTM bidireccional tiene 320 neuronas y la salida de la capa final no está secuenciada. Las salidas de RNN y DNN se concatenan y luego se alimentan a una red neuronal profunda más grande que consta de 6 capas de 1000 neuronas cada una. La salida final es de 403 neuronas sin función de activación aplicada. Experimentamos con diferentes métodos para combinar las dos salidas, incluida la multiplicación, suma y resta de matrices, pero descubrimos que la concatenación siempre arrojaba los mejores resultados.
Para entrenar todos los modelos, utilizamos una función de pérdida MSE y validamos/evaluamos usando una puntuación MAE basada en las ecuaciones. (1) y (2) respectivamente, donde \(Y_{i}\) es el valor predicho. Un cambio clave en la capacitación del modelo en comparación con los resultados anteriores es que todos los datos están disponibles para la red y no hay materiales "invisibles" en el proceso de capacitación. Para el proceso de generación de la red, utilizamos varios materiales que están fuera del alcance del proceso de capacitación, pero no se generaron datos de simulación para estos materiales antes de la capacitación de la red inversa. La lista completa de materiales incluidos en la capacitación y en la generación de redes se proporciona en el
En todos los casos, la optimización de los hiperparámetros se realiza con el método de optimización de hiperbanda integrado80. Adam es el motor de optimización utilizado para el entrenamiento de la red en todos los casos. Para minimizar el sobreajuste, utilizamos la regularización L2 en el proceso de capacitación y validación, además de utilizar la detención anticipada, el guardado en el punto de control y la reducción de la tasa de aprendizaje en las devoluciones de llamada de meseta con valores bajos de paciencia72. Algunos modelos incorporan capas de abandono para reducir aún más el sobreajuste del modelo.
Todos los conjuntos de datos utilizados por las redes neuronales se derivan directamente de las entradas y salidas de la simulación FDTD. Para cada material en el conjunto de datos de entrenamiento/validación/prueba de los modelos sustitutos, generamos una matriz aleatoria uniformemente distribuida para cada una de las propiedades geométricas para usar como entradas para la simulación. La longitud de onda de simulación y los valores de n y k se toman de cada simulación y se dividen en conjuntos de datos de entrada, que abarcan un total de 8 entradas neuronales (n y k se convierten en εreal y εim). La salida de la simulación es 100 puntos de emisividad y 100 puntos de reflectividad que coinciden uno a uno con el vector de longitud de onda de la simulación, que se divide en pares para cada λ. El valor de la permitividad εreal es de particular interés debido a los valores negativos inducidos por el término -k2 que se muestra en la ecuación. (4).
Un problema fundamental al que se enfrenta es que, ópticamente, la diferencia entre k = 1e-4 y 1e-3 no es matemáticamente grande, pero la diferencia tiene un gran impacto en el comportamiento de transmisión a través del sustrato. Por lo tanto, los datos se agrupan cerca de 0, pero necesitamos diferenciar los valores de manera significativa para distinguir el comportamiento físico de cada material. La normalización de registros reduce la gravedad de las entradas ponderadas, pero no las resuelve. Para todos los conjuntos de datos que se muestran en este trabajo, utilizamos la normalización de cuantiles con el transformador de cuantiles incorporado de sklearn, para generar una distribución uniforme de entradas para k, tsub, εreal y εim. Un cambio con respecto a nuestros resultados anteriores72 es que simplificamos la canalización de normalización al normalizar el índice de refracción n y las propiedades geométricas mediante el método del cuantil. Todos los conjuntos de datos utilizados en este trabajo y las técnicas utilizadas para normalizar, desnormalizar y configurar los datos se proporcionan en nuestro repositorio de GitHub.
Para los modelos sustitutos, combinamos 40 500 simulaciones FDTD para micropirámides hechas de 41 materiales diferentes para formar nuestro conjunto de datos de entrenamiento, validación y prueba. Seguimos una división porcentual 70/20/10 respectivamente. El conjunto de datos de prueba se utiliza para evaluar el rendimiento y el sobreajuste del modelo y la red no lo ve en el proceso de entrenamiento. Mezclamos el conjunto de datos completo cada vez que se ejecuta o genera el modelo, de modo que los conjuntos de datos de entrenamiento, validación y prueba nunca sean idénticos de una iteración a otra.
Para el modelo inverso, los datos de entrenamiento se generan utilizando los datos sustitutos. Mientras que el sustituto proporciona la reflectividad y la transmisividad proporcionan una salida para un punto de longitud de onda individual, el inverso utiliza una entrada de vector completo al apilar las predicciones del sustituto. La entrada de vector de longitud de onda completa que corresponde a una salida a la que nos referimos como "simulación sustituta". Para cada material, desarrollamos una cuadrícula de simulaciones sustitutas variando el xspan y el zspan de la micropirámide y adjuntando un vector de longitud de onda aleatorio y un valor de espesor para cada conjunto individual de (xspan, zspan) en la cuadrícula. La cuadrícula se genera utilizando un proceso de aleatorización para pares de coordenadas geométricas x y z. El proceso verifica que cada material no tenga pares repetidos. El proceso de aleatorización del vector de longitud de onda implica la creación de un vector espaciado linealmente de 100 puntos con un valor mínimo y máximo aleatorio. Los valores mínimo y máximo son los parámetros generados aleatoriamente y están entre (0,3–15) y (2–16) μm respectivamente. Si el "valor mínimo" seleccionado aleatoriamente es mayor que el valor "máximo", los valores se cambian al generar el vector de longitud de onda. El proceso aleatorio se repite para garantizar que la brecha entre los valores de longitud de onda mínimo y máximo sea de 2 um. La información del material se genera al ingresar el vector de longitud de onda generado en un ajuste de curva ranurada. Los ajustes de curvas spline se generan utilizando un conjunto de datos de 2000 puntos para cada material. Debido al tamaño del conjunto de datos inverso, adoptamos una división de entrenamiento/validación/prueba 50/40/10 para el proceso de entrenamiento de la red inversa.
La salida de la red neuronal inversa contiene un vector de valores de n y k, emparejados con una entrada de puntos de longitud de onda. Para proporcionar el material de "mejor ajuste", comparamos los datos del material (n, k) con los datos del material en la biblioteca. Los datos de la biblioteca se generan usando el mismo proceso spline que se describe en la sección anterior y depende del espectro de longitud de onda del usuario que se ingresó en la red inversa. Verificamos cada combinación de vectores (n, k) en la biblioteca de materiales con la salida del modelo utilizando el método de mínimos cuadrados que se muestra en la ecuación. (5).
Antes de comparar los valores usando la Ec. (5), ajustamos el vector (n,k) usando una transformación logarítmica que se muestra en la ecuación. (6). Mientras que una comparación usando la Ec. (5) sigue siendo viable, el ajuste logarítmico permite mejores comparaciones con materiales que dependen en gran medida de pequeñas diferencias en los valores de n, k. Como se discutió, los materiales transmisivos dependen en gran medida de pequeños cambios en los valores de n y k, por lo que tener una escala que permita una mejor comparación para valores pequeños nos permite sacar mejores conclusiones de la ecuación. 6 en cuanto a qué materiales se adaptan mejor a la salida de ML.
En el módulo de posprocesamiento, ajustamos la salida de la red inversa de acuerdo con las restricciones establecidas por el usuario. En nuestro trabajo actual, solo limitamos la relación de aspecto, pero el método se puede ajustar fácilmente para tener en cuenta más condiciones. Para hacer esto, generamos dos conjuntos de nuevas coordenadas geométricas (para el mismo material) que no violan la restricción. El proceso comienza ajustando las coordenadas x y z de la solución original mientras se fija la otra coordenada hasta que la relación de aspecto esté dentro de los límites de la restricción. Esto sigue nuestra intuición previamente establecida sobre el papel de la relación de aspecto en la determinación de la propiedad óptima óptica/térmica20. Para una microestructura diferente, necesitaríamos ajustar este proceso para que coincida con los patrones observados para la microtextura y la restricción deseada. A partir de estos dos nuevos puntos, generamos nuevos pares geométricos dentro de un radio alrededor de la coordenada geométrica modificada. El proceso de generación es aleatorio y uniforme, y se eliminan las soluciones que no están por debajo o igual a la relación de aspecto deseada. Luego, todas las soluciones viables se pasan al sustituto para las predicciones; los resultados que mejor coinciden con la entrada deseada se simulan en FDTD. También seleccionamos puntos aleatorios del grupo restante de soluciones geométricas viables generadas aleatoriamente para tener una variedad de soluciones adicional y reducir las preocupaciones de sesgar demasiado la red cuando el sustituto incorpora las nuevas soluciones FDTD en el entrenamiento. La entrada deseada y el modelo/salidas FDTD se evalúan para optimizar utilizando Eq. (5). Este proceso se utiliza para generar soluciones por separado para la salida directa del material de ML y luego los materiales "más adecuados". A menudo, solo usaremos un único material que "mejor se adapte", pero en algunos casos miraremos más allá de la primera coincidencia de la biblioteca.
Raman, AP, Anoma, MA, Zhu, L., Rephaeli, E. y Fan, S. Enfriamiento radiativo pasivo por debajo de la temperatura del aire ambiente bajo la luz solar directa. Naturaleza 515, 540–544. https://doi.org/10.1038/nature13883 (2014).
Artículo ADS CAS PubMed Google Scholar
Nie, X. et al. Recubrimientos poliméricos de color blanco frío a base de burbujas de vidrio para edificios. ciencia Rep. 10, 1–10. https://doi.org/10.1038/s41598-020-63027-2 (2020).
Artículo ADS CAS Google Académico
Zhai, Y. et al. Metamaterial híbrido de polímero de vidrio aleatorizado de fabricación escalable para enfriamiento radiativo diurno. Ciencia 355, 1062–1066. https://doi.org/10.1126/science.aai7899 (2017).
Artículo ADS CAS PubMed Google Scholar
Yin, X., Yang, R., Tan, G. & Fan, S. Enfriamiento radiativo terrestre: uso del universo frío como fuente de energía renovable y sostenible. Ciencia 370, 786–791. https://doi.org/10.1126/science.abb0971 (2020).
Artículo ADS CAS PubMed Google Scholar
Li, P. et al. Absorbedores selectivos solares nanofotónicos a gran escala para la conversión de energía solar térmica de alta eficiencia. Adv. Mate. 27, 4585–4591. https://doi.org/10.1002/adma.201501686 (2015).
Artículo CAS PubMed Google Académico
Kumar, R. & Rosen, MA Rendimiento térmico del calentador de agua solar de almacenamiento de colector integrado con superficie absorbente corrugada. aplicación Termia. Ing. 30, 1764–1768. https://doi.org/10.1016/j.applthermaleng.2010.04.007 (2010).
Artículo Google Académico
Pfiester, NA & Vandervelde, TE Emisores selectivos para aplicaciones termofotovoltaicas. física Aplicación Status Solidi. Mate. ciencia 214, 1–24. https://doi.org/10.1002/pssa.201600410 (2017).
Artículo CAS Google Académico
Li, W. & Fan, S. Control nanofotónico de la radiación térmica para aplicaciones energéticas [Invitado]. Optar. Expreso 26, 15995. https://doi.org/10.1364/oe.26.015995 (2018).
Artículo ADS CAS PubMed Google Scholar
Mandal, J. et al. Recubrimientos poliméricos jerárquicamente porosos para enfriamiento radiativo diurno pasivo altamente eficiente. Ciencia 362, 315–319. https://doi.org/10.1126/science.aat9513 (2018).
Artículo ADS CAS PubMed Google Scholar
Dang, S., Wang, X. & Ye, H. Una estructura fotónica de enfriamiento radiativo transparente ultradelgada con una alta reflexión NIR. Adv. Mate. Interfaces 2201050, 1–10. https://doi.org/10.1002/admi.202201050 (2022).
Artículo CAS Google Académico
Yu, Z., Nie, X., Yuksel, A. & Lee, J. Reflectividad de compuestos de microesferas sólidas y huecas y los efectos de diámetros uniformes y variables. Aplicación J. física https://doi.org/10.1063/5.0015650 (2020).
Artículo Google Académico
Nie, X., Yu, Z., Jackson, E. & Lee, J. Índice de refracción y coeficiente de extinción de microesferas huecas para la reflexión solar. aplicación física Letón. https://doi.org/10.1063/5.0049018 (2021).
Artículo Google Académico
Sala-Casanovas, M., Krishna, A., Yu, Z. & Lee, J. Emisores selectivos estirables bioinspirados basados en níquel corrugado para la gestión térmica personal. Nanoescala Microescala Thermophys. Ing. 23, 173–187. https://doi.org/10.1080/15567265.2019.1586017 (2019).
Artículo ADS CAS Google Académico
Krishna, A. et al. Control de emisividad ultravioleta a infrarrojo medio mediante grafeno reconfigurable mecánicamente. Nano Lett. 19, 5086–5092. https://doi.org/10.1021/acs.nanolett.9b01358 (2019).
Artículo ADS CAS PubMed Google Scholar
Zhu, J., Hsu, CM, Yu, Z., Fan, S. y Cui, Y. Células solares de nanodomo con gestión eficiente de la luz y autolimpieza. Nano Lett. 10, 1979–1984. https://doi.org/10.1021/nl9034237 (2010).
Artículo ADS CAS PubMed Google Scholar
Lee, BJ, Chen, YB, Han, S., Chiu, FC y Lee, HJ Absorbedor térmico solar selectivo de longitud de onda con rejillas bidimensionales de níquel. J. Transferencia de calor 136, 1–7. https://doi.org/10.1115/1.4026954 (2014).
Artículo CAS Google Académico
Zhou, L., Yu, X. & Zhu, J. Nanoconos de núcleo metálico/capa de semiconductor para mejorar la absorción solar de banda ancha. Nano Lett. 14, 1093–1098. https://doi.org/10.1021/nl500008y (2014).
Artículo ADS CAS PubMed Google Scholar
Lung, CM, Wang, WC, Chen, CH, Chen, LY & Chen, MJ ZnO/Al2O3 matriz de nanovarillas de núcleo/carcasa como excelentes capas antirreflectantes en células solares de silicio. Mate. química física 180, 195–202. https://doi.org/10.1016/j.matchemphys.2016.05.063 (2016).
Artículo CAS Google Académico
Söndergaard, T. et al. Oro negro plasmónico por nanoenfoque adiabático y absorción de luz en surcos convexos ultranítidos. Nat. común 3, 1–6. https://doi.org/10.1038/ncomms1976 (2012).
Artículo CAS Google Académico
Sullivan, J., Yu, Z. & Lee, J. Análisis óptico y optimización de la textura de la micropirámide para el control de la radiación térmica. Nanoescala Microescala Thermophys. Ing. https://doi.org/10.1080/15567265.2021.195896010(1080/15567265),pp.1958960,2021 (2021).
Artículo Google Académico
Campbell, P. & Green, MA Propiedades de atrapamiento de luz de superficies con textura piramidal. Aplicación J. física 62, 243–249. https://doi.org/10.1063/1.339189 (1987).
Artículo ANUNCIOS Google Académico
Leon, JJD, Hiszpanski, AM, Bond, TC & Kuntz, JD Reglas de diseño para adaptar las propiedades antirreflectantes de las estructuras ópticas jerárquicas. Adv. Optar. Mate. 5, 1–8. https://doi.org/10.1002/adom.201700080 (2017).
Artículo CAS Google Académico
Zhang, T. et al. Silicona negra con superficie autolimpiante preparada por procesos de humectación. Resolución a nanoescala Letón. 8, 1–5. https://doi.org/10.1186/1556-276X-8-351 (2013).
Artículo ADS CAS Google Académico
Liu, Y. et al. Estructuras texturizadas robustas jerárquicas para células solares de silicio negro autolimpiantes a gran escala. Nano Energía 3, 127–133. https://doi.org/10.1016/j.nanoen.2013.11.002 (2014).
Artículo CAS Google Académico
Dimitrov, DZ & Du, CH Células solares de silicio cristalino con textura micro/nano. aplicación Navegar. ciencia 266, 1–4. https://doi.org/10.1016/j.apsusc.2012.10.081 (2013).
Artículo ADS CAS Google Académico
Nishijima, Y. et al. Superficies antirreflectantes: Nano/microestructuración en cascada. Fotón APL. https://doi.org/10.1063/1.4964851 (2016).
Artículo Google Académico
Mavrokefalos, A., Han, SE, Yerci, S., Branham, MS y Chen, G. Atrapamiento de luz eficiente en membranas de silicio cristalino delgadas de nanopirámide invertida para aplicaciones de células solares. Nano Lett. 12, 2792–2796. https://doi.org/10.1021/nl2045777 (2012).
Artículo ADS CAS PubMed Google Scholar
Wang, H. & Wang, L. Absorbedores solares de metamateriales selectivos perfectos. Optar. Expreso 21, A1078. https://doi.org/10.1364/oe.21.0a1078 (2013).
Artículo ADS PubMed Google Scholar
Sai, H., Yugami, H., Kanamori, Y. & Hane, K. Absorbedores selectivos solares basados en rejillas de superficie W bidimensionales con períodos submicrónicos para conversión fototérmica de alta temperatura. Sol. Materia Energética. Sol. Celdas 79, 35–49. https://doi.org/10.1016/S0927-0248(02)00364-1 (2003).
Artículo CAS Google Académico
Qi, Z. et al. Pirámides de silicio decoradas con nanopartículas de oro para la fotodetección de infrarrojo cercano de electrones calientes mejorada con plasmones. Nanotecnología https://doi.org/10.1088/1361-6528/aa74a3 (2017).
Artículo PubMed Google Académico
Zhai, Y., Li, Y., Ji, J., Wu, Z. & Wang, Q. Generación de electrones calientes en micropirámides de silicio cubiertas con películas de oro de nanómetros de espesor para fotodetectores de infrarrojo cercano. Aplicación ACS. Nano Materia. 3, 149–155. https://doi.org/10.1021/acsanm.9b01840 (2020).
Artículo CAS Google Académico
Sullivan, J., Yu, Z. & Lee, J. Recubrimientos de níquel de espesor nanométrico en micropirámides de silicio para absorción infrarroja. Aplicación ACS. Nano Materia. 5, 4615–4622. https://doi.org/10.1021/acsanm.2c00541 (2022).
Artículo CAS Google Académico
Deinega, A., Valuev, I., Potapkin, B. y Lozovik, Y. Minimización de la reflexión de la luz en superficies texturizadas dieléctricas. J. Opt. Soc. Soy. A 28, 770. https://doi.org/10.1364/josaa.28.000770 (2011).
Artículo ANUNCIOS Google Académico
Zhang, H. et al. Películas fotónicas flexibles de inspiración biológica para un enfriamiento radiativo pasivo eficiente. proc. nacional Academia ciencia 117, 202001802. https://doi.org/10.1073/pnas.2001802117 (2020).
Artículo CAS Google Académico
Shore, KA Métodos numéricos en fotónica, por Andrei V. Lavrinenko, Jesper Laegsgaard, Niles Gregersen, Frank Schmidt y Thomas Sondergaard. Física contemporánea vol. 57 (2016). https://doi.org/10.1080/00107514.2015.1133707.
Malkiel, I. et al. Diseño y caracterización de nanoestructuras plasmónicas mediante Deep Learning. Ciencia de la luz aplicación https://doi.org/10.1038/s41377-018-0060-7 (2018).
Artículo PubMed PubMed Central Google Académico
Bojarski, M. et al. Aprendizaje de extremo a extremo para vehículos autónomos. 1–9 (2016).
Sainath, TN, Vinyals, O., Senior, A. & Sak, H. Convolucional, memoria a corto plazo, redes neuronales profundas totalmente conectadas. ICASSP, IEEE Int. Conf. acústico Proceso de señal de voz. - Proc. 2015-agosto, 4580–4584 (2015). https://doi.org/10.1109/ICASSP.2015.7178838.
Bock, K. & Garnsey, SM Procesamiento del lenguaje. en A Companion to Cognitive Science vol. 349 226–234 (Blackwell Publishing Ltd, 2017). https://doi.org/10.1002/9781405164535.ch14.
Sajedian, I., Kim, J. & Rho, J. Encontrar las propiedades ópticas de las estructuras plasmónicas mediante el procesamiento de imágenes utilizando una combinación de redes neuronales convolucionales y redes neuronales recurrentes. Microsistema Nanoeng. https://doi.org/10.1038/s41378-019-0069-y (2019).
Artículo PubMed PubMed Central Google Académico
Seo, J. et al. Diseño de un absorbedor solar térmico de banda ancha utilizando una red neuronal profunda y demostración experimental de su funcionamiento. ciencia Rep. 9, 1–9. https://doi.org/10.1038/s41598-019-51407-2 (2019).
Artículo ADS CAS Google Académico
Wu, D. et al. El diseño de un absorbedor casi perfecto selectivo de banda ultraancha basado en estructuras fotónicas para lograr un enfriamiento radiativo diurno casi ideal. Mate. Des. 139, 104–111. https://doi.org/10.1016/j.matdes.2017.10.077 (2018).
Artículo Google Académico
Han, S., Shin, JH, Jung, PH, Lee, H. & Lee, BJ Absorbedor térmico solar de banda ancha basado en metamateriales ópticos para aplicaciones de alta temperatura. Adv. Optar. Mate. 4, 1265–1273. https://doi.org/10.1002/adom.201600236 (2016).
Artículo CAS Google Académico
Elzouka, M., Yang, C., Albert, A., Prasher, RS y Lubner, SD Diseño directo e inverso interpretable de la emisividad espectral de partículas utilizando modelos comunes de aprendizaje automático. Rep. celular Phys. ciencia 1, 100259. https://doi.org/10.1016/j.xcrp.2020.100259 (2020).
Artículo Google Académico
Peurifoy, J. et al. Simulación de partículas nanofotónicas y diseño inverso mediante redes neuronales artificiales. arXiv 1–8 (2017). https://doi.org/10.1117/12.2289195https://doi.org/10.1117/12.2289195.
Balin, I., Garmider, V., Long, Y. & Abdulhalim, I. Red neuronal artificial de entrenamiento para la optimización del rendimiento de ventana inteligente basada en VO 2 nanoestructurado. Optar. Expreso 27, A1030. https://doi.org/10.1364/oe.27.0a1030 (2019).
Artículo ADS CAS PubMed Google Scholar
Wu, S. et al. Descubrimiento asistido por aprendizaje automático de polímeros con alta conductividad térmica utilizando un algoritmo de diseño molecular. Cálculo de Npj. Mate. https://doi.org/10.1038/s41524-019-0203-2 (2019).
Artículo Google Académico
Suh, Y., Bostanabad, R. & Won, Y. El aprendizaje profundo predice la transferencia de calor por ebullición. ciencia Rep. 11, 1–10. https://doi.org/10.1038/s41598-021-85150-4 (2021).
Artículo ADS CAS Google Académico
Kudyshev, ZA, Kildishev, AV, Shalaev, VM y Boltasseva, A. Diseño de metasuperficies asistido por aprendizaje automático para la optimización de emisores térmicos de alta eficiencia. aplicación física Rev. https://doi.org/10.1063/1.5134792 (2020).
Artículo Google Académico
Kang, HH, Kaya, M. y Hajimirza, S. Un modelo de red neuronal artificial basado en datos para predecir las propiedades radiativas de lechos metálicos empaquetados. J. Cuant. Espectrosc. radiar Transf. 226, 66–72. https://doi.org/10.1016/j.jqsrt.2019.01.013 (2019).
Artículo ADS CAS Google Académico
Tausendschön, J. & Radl, S. Modelado de radiación de calor basado en redes neuronales profundas entre partículas y entre paredes y partículas. En t. J. Transferencia de masa de calor. https://doi.org/10.1016/j.ijheatmasstransfer.2021.121557 (2021).
Artículo Google Académico
Wiecha, PR, Arbouet, A., Girard, C. y Muskens, OL Aprendizaje profundo en nanofotónica: diseño inverso y más allá. arXiv 9, 182–200 (2020). https://doi.org/10.1364/prj.415960.
Lee, D., Jiang, S., Balogun, O. & Chen, W. Control dinámico de la localización plasmónica mediante optimización inversa de la modulación de fase espacial. Fotón ACS. 9, 351–359. https://doi.org/10.1021/acsphotonics.1c01043 (2022).
Artículo CAS Google Académico
He, J., He, C., Zheng, C., Wang, Q. & Ye, J. Simulaciones de nanopartículas plasmónicas y diseño inverso mediante aprendizaje automático. Nanoescala 11, 17444–17459. https://doi.org/10.1039/c9nr03450a (2019).
Artículo CAS PubMed Google Académico
Gao, L., Li, X., Liu, D., Wang, L. y Yu, Z. Una red neuronal profunda bidireccional para un diseño de color de silicio preciso. Adv. Mate. 31, 1–7. https://doi.org/10.1002/adma.201905467 (2019).
Artículo ADS CAS Google Académico
Ma, W., Cheng, F., Xu, Y., Wen, Q. & Liu, Y. Representación probabilística y diseño inverso de metamateriales basados en un modelo generativo profundo con estrategia de aprendizaje semisupervisado. Adv. Mate. 31, 1–9. https://doi.org/10.1002/adma.201901111 (2019).
Artículo CAS Google Académico
Molesky, S. et al. Diseño inverso en nanofotónica. Nat. Fotón. 12, 659–670. https://doi.org/10.1038/s41566-018-0246-9 (2018).
Artículo ADS CAS Google Académico
Kudyshev, ZA, Kildishev, AV, Shalaev, VM y Boltasseva, A. Optimización global de dispositivos fotónicos asistida por aprendizaje automático. Frente. Optar. Fotónica 10, 381–393. https://doi.org/10.1515/9783110710687-028 (2021).
Artículo Google Académico
Kalt, V. et al. Metamodelado de rejillas de alto índice de contraste para la reproducción del color. J. Opt. Soc. Soy. A 36, 79. https://doi.org/10.1364/josaa.36.000079 (2019).
Artículo ANUNCIOS Google Académico
Ma, W., Cheng, F. y Liu, Y. Diseño bajo demanda habilitado para aprendizaje profundo de metamateriales quirales. ACS Nano 12, 6326–6334. https://doi.org/10.1021/acsnano.8b03569 (2018).
Artículo CAS PubMed Google Académico
Liu, D., Tan, Y., Khoram, E. & Yu, Z. Entrenamiento de redes neuronales profundas para el diseño inverso de estructuras nanofotónicas. Fotón ACS. 5, 1365–1369. https://doi.org/10.1021/acsphotonics.7b01377 (2018).
Artículo CAS Google Académico
Entonces, S. & Rho, J. Diseño de estructuras nanofotónicas utilizando redes antagónicas generativas convolucionales profundas condicionales. Nanofotónica 8, 1255–1261. https://doi.org/10.1515/nanoph-2019-0117 (2019).
Artículo Google Académico
Liu, Z., Zhu, D., Rodrigues, SP, Lee, KT & Cai, W. Modelo generativo para el diseño inverso de metasuperficies. Nano Lett. 18, 6570–6576. https://doi.org/10.1021/acs.nanolett.8b03171 (2018).
Artículo ADS CAS PubMed Google Scholar
Shi, X., Qiu, T., Wang, J., Zhao, X. y Qu, S. Diseño inverso de metasuperficies utilizando enfoques de aprendizaje automático. J. física. D. Apl. física https://doi.org/10.1088/1361-6463/ab8036 (2020).
Artículo Google Académico
Deng, L., Xu, Y. y Liu, Y. Diseño inverso híbrido de estructuras fotónicas mediante la combinación de métodos de optimización con redes neuronales. Fotón. Nanoestructura. Fundam. aplicación 52, 101073. https://doi.org/10.1016/j.photonics.2022.101073 (2022).
Artículo Google Académico
Jiang, X. et al. Implementación de enfriamiento radiativo con un emisor selectivo de diseño inverso. Optar. común 497, 127209. https://doi.org/10.1016/j.optcom.2021.127209 (2021).
Artículo CAS Google Académico
Dong, R., Dan, Y., Li, X. & Hu, J. Diseño inverso de materiales ópticos de óxido de metal compuesto basado en aprendizaje de transferencia profundo y optimización global. computar Mate. ciencia 188, 110166. https://doi.org/10.1016/j.commatsci.2020.110166 (2021).
Artículo CAS Google Académico
Jiang, X. et al. Emisor selectivo sintonizable de infrarrojo medio basado en metasuperficie de diseño inverso para sigilo infrarrojo con gestión térmica. Optar. Expreso 30, 18250. https://doi.org/10.1364/oe.456791 (2022).
Artículo ADS CAS PubMed Google Scholar
Jiang, X. et al. Metasuperficie basada en diseño inverso para maximizar la absorción espectral solar. Adv. Optar. Mate. 9, 1–11. https://doi.org/10.1002/adom.202100575 (2021).
Artículo CAS Google Académico
Macleod, HA Filtros ópticos de película delgada. Opción de película delgada. Filtros https://doi.org/10.1887/075030688210.1887/0750306882 (1986).
Artículo ANUNCIOS Google Académico
Wei, WR et al. Células solares híbridas orgánicas-inorgánicas con una eficiencia superior al 11% con características de recolección omnidireccional mediante el empleo de estructuras jerárquicas de captura de fotones. Nano Lett. 13, 3658–3663. https://doi.org/10.1021/nl401540h (2013).
Artículo ADS CAS PubMed Google Scholar
Sullivan, J., Mirhashemi, A. & Lee, J. Análisis basado en el aprendizaje profundo de materiales microestructurados para el control de la radiación térmica. ciencia Rep. 12, 1–14. https://doi.org/10.1038/s41598-022-13832-8 (2022).
Artículo CAS Google Académico
An, S. et al. Un enfoque de aprendizaje profundo para el diseño de metasuperficies totalmente dieléctricas basadas en objetivos. Fotón ACS. 6, 3196–3207. https://doi.org/10.1021/acsphotonics.9b00966 (2019).
Artículo CAS Google Académico
Chan, DLC, Soljačić, M. & Joannopoulos, JD Diseño y emisión térmica en losas de cristal fotónico metálico periódico unidimensional. física Estado rev. Física no lineal de materia blanda. 74, 206–214. https://doi.org/10.1103/PhysRevE.74.016609 (2006).
Artículo CAS Google Académico
Krishna, A. & Lee, J. Emisividad impulsada por la morfología de estructuras en forma de árbol a microescala para la gestión térmica radiativa. Nanoescala Microescala Thermophys. Ing. 22, 124–136. https://doi.org/10.1080/15567265.2018.1446065 (2018).
Artículo ADS CAS Google Académico
Yee, K. Solución numérica de problemas iniciales de valor límite que involucran las ecuaciones de Maxwell en medios isotrópicos. Trans. IEEE. Propagación de antenas 14, 302–307. https://doi.org/10.1109/TAP.1966.1138693 (1966).
Artículo ADS MATH Google Scholar
Lee, D. et al. Modelo acústico basado en redes neuronales recurrentes de memoria a corto plazo utilizando clasificación temporal conexionista en un corpus de entrenamiento a gran escala. Comun de China. 14, 23–31. https://doi.org/10.1109/CC.2017.8068761 (2017).
Artículo Google Académico
Wan, C. et al. Sobre las propiedades ópticas del dióxido de vanadio de película delgada desde el visible hasta el infrarrojo lejano. Ana. física 1900188, 1900188. https://doi.org/10.1002/andp.201900188 (2019).
Artículo CAS Google Académico
Chollet, F. Keras. https://github.com/fchollet/keras (2015).
Li, L., Jamieson, K., DeSalvo, G., Rostamizadeh, A. & Talwalkar, A. Hyperband: un nuevo enfoque basado en bandidos para la optimización de hiperparámetros. J. Mach. Aprender. Res. 18, 1–52 (2018).
MathSciNet MATEMÁTICAS Google Académico
Descargar referencias
La financiación fue proporcionada por la NASA (Grant Nos. 80NSSC19K1671, 80NSSC19K1671).
Departamento de Ingeniería Mecánica y Aeroespacial, Universidad de California, Irvine, CA, EE. UU.
Jonathan Sullivan y Jaeho Lee
Centro de Investigación Glenn de la NASA, Cleveland, OH, EE. UU.
arman mirhashemi
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
También puede buscar este autor en PubMed Google Scholar
JS, AM y JL concibieron la idea. JS contribuyó a la generación de modelos de aprendizaje profundo, optimización y preparación de conjuntos de datos. JS contribuyó a las simulaciones FDTD. JS contribuyó a la generación e implementación del algoritmo de búsqueda de materiales, la red neuronal tándem y la arquitectura de red agregada. Todos los autores discutieron los resultados y revisaron el manuscrito.
Correspondencia a Jaeho Lee.
Los autores declaran no tener conflictos de intereses.
Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.
Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.
Reimpresiones y permisos
Sullivan, J., Mirhashemi, A. & Lee, J. Diseño inverso basado en aprendizaje profundo de materiales microestructurados para optimización óptica y control de radiación térmica. Informe científico 13, 7382 (2023). https://doi.org/10.1038/s41598-023-34332-3
Descargar cita
Recibido: 07 Diciembre 2022
Aceptado: 27 de abril de 2023
Publicado: 06 mayo 2023
DOI: https://doi.org/10.1038/s41598-023-34332-3
Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:
Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.
Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt
Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.