{"id":6615,"date":"2026-05-06T17:57:31","date_gmt":"2026-05-06T22:57:31","guid":{"rendered":"https:\/\/ykim.synology.me\/wordpress\/?p=6615"},"modified":"2026-05-06T19:36:04","modified_gmt":"2026-05-07T00:36:04","slug":"an-introductory-survey-on-polynomial-machine-learning-taxonomic-axes-and-hierarchical-levels","status":"publish","type":"post","link":"https:\/\/ykim.synology.me\/wordpress\/an-introductory-survey-on-polynomial-machine-learning-taxonomic-axes-and-hierarchical-levels-6615\/","title":{"rendered":"An Introductory Survey on Polynomial Machine Learning: Taxonomic Axes and Hierarchical Levels"},"content":{"rendered":"\n<figure class=\"wp-block-image size-full is-resized\"><img loading=\"lazy\" decoding=\"async\" width=\"800\" height=\"600\" src=\"https:\/\/ykim.synology.me\/wordpress\/wp-content\/uploads\/2026\/05\/Whataburger-Austin-800x600px.jpg\" alt=\"\" class=\"wp-image-6620\" style=\"width:600px\" srcset=\"https:\/\/ykim.synology.me\/wordpress\/wp-content\/uploads\/2026\/05\/Whataburger-Austin-800x600px.jpg 800w, https:\/\/ykim.synology.me\/wordpress\/wp-content\/uploads\/2026\/05\/Whataburger-Austin-800x600px-300x225.jpg 300w, https:\/\/ykim.synology.me\/wordpress\/wp-content\/uploads\/2026\/05\/Whataburger-Austin-800x600px-768x576.jpg 768w\" sizes=\"auto, (max-width: 800px) 100vw, 800px\" \/><\/figure>\n\n\n<style>.kadence-column6615_17aca9-70 > .kt-inside-inner-col,.kadence-column6615_17aca9-70 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_17aca9-70 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_17aca9-70 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_17aca9-70 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_17aca9-70 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_17aca9-70{position:relative;}.kadence-column6615_17aca9-70, .kt-inside-inner-col > .kadence-column6615_17aca9-70:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_17aca9-70 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_17aca9-70 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_17aca9-70\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003This report surveys Polynomial Machine Learning (PML) at an introductory level. PML refers to the family of techniques that exploit higher-order and interaction terms of input variables to learn nonlinear relationships. The discussion is organized along <strong>three taxonomic axes<\/strong> and arranged into <strong>six hierarchical levels<\/strong>. Deep mathematical or theoretical analysis is intentionally avoided; the goal is to provide a structured starting point for further study.<\/p>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Taxonomic Axes and Hierarchical Levels<\/h2>\n\n\n<style>.kadence-column6615_199085-1d > .kt-inside-inner-col,.kadence-column6615_199085-1d > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_199085-1d > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_199085-1d > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_199085-1d > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_199085-1d > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_199085-1d{position:relative;}.kadence-column6615_199085-1d, .kt-inside-inner-col > .kadence-column6615_199085-1d:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_199085-1d > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_199085-1d > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_199085-1d\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The taxonomy uses three classification axes as a coordinate system, and the six levels are positions arranged along that system.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Axis<\/th><th>Meaning<\/th><th>Levels<\/th><\/tr><\/thead><tbody><tr><td><strong>Axis A: Mathematical Foundation<\/strong><\/td><td>On which mathematical property (orthogonality, domain) <br>the polynomial is defined<\/td><td>Level 1, Level 2<\/td><\/tr><tr><td><strong>Axis B: Model Architecture<\/strong><\/td><td>Into which computational structure (neural network, tensor decomposition) <br>the polynomial is embedded<\/td><td>Level 3, Level 4<\/td><\/tr><tr><td><strong>Axis C: Application Pattern<\/strong><\/td><td>How the polynomial is combined with or <br>discovered from other models<\/td><td>Level 5, Level 6<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Evolution Across Levels (Add \/ Subtract \/ Exchange)<\/h2>\n\n\n<style>.kadence-column6615_f07420-b6 > .kt-inside-inner-col,.kadence-column6615_f07420-b6 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_f07420-b6 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_f07420-b6 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_f07420-b6 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_f07420-b6 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_f07420-b6{position:relative;}.kadence-column6615_f07420-b6, .kt-inside-inner-col > .kadence-column6615_f07420-b6:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_f07420-b6 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_f07420-b6 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_f07420-b6\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The following table shows what is added (+), removed (\u2212), or exchanged (\u2194) when moving from one level to the next.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Transition<\/th><th>(+) Added<\/th><th>(\u2212) Removed<\/th><th>(\u2194) Exchanged<\/th><\/tr><\/thead><tbody><tr><td><strong>L1 \u2192 L2<\/strong><\/td><td>Orthogonality constraint, link to <br>probability distributions<\/td><td>Free use of arbitrary monomials<\/td><td>Power basis \u2194 Orthogonal polynomial basis<\/td><\/tr><tr><td><strong>L2 \u2192 L3<\/strong><\/td><td>Learnable weights, hierarchical layers, <br>optional activations<\/td><td>Closed-form coefficient estimation<\/td><td>Single regression equation \u2194 Multilayer neural network<\/td><\/tr><tr><td><strong>L3 \u2192 L4<\/strong><\/td><td>Tensor decomposition, <br>latent vector representation<\/td><td>Per-term explicit weight<\/td><td>Explicit term weight \u2194 Latent vector inner product<\/td><\/tr><tr><td><strong>L4 \u2192 L5<\/strong><\/td><td>Coupling with non-polynomial models <br>(GP, CNN, physics)<\/td><td>Single-model assumption<\/td><td>Polynomial-only model \u2194 Polynomial + residual hybrid<\/td><\/tr><tr><td><strong>L5 \u2192 L6<\/strong><\/td><td>Discovery of the equation itself <br>from data<\/td><td>Pre-fixed model form<\/td><td>Human-prescribed form \u2194 Data-discovered form<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Taxonomy Hierarchy<\/h2>\n\n\n<style>.kadence-column6615_165e3a-9b > .kt-inside-inner-col,.kadence-column6615_165e3a-9b > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_165e3a-9b > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_165e3a-9b > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_165e3a-9b > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_165e3a-9b > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_165e3a-9b{position:relative;}.kadence-column6615_165e3a-9b, .kt-inside-inner-col > .kadence-column6615_165e3a-9b:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_165e3a-9b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_165e3a-9b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_165e3a-9b\"><div class=\"kt-inside-inner-col\">\n<pre style=\"font-family: consolas,monospace; font-size: 1.2rem; white-space: pre; line-height:1.2; background-color: #fff; border: none\">\nPolynomial Machine Learning (PML)\n\u2502\n[Axis A: Mathematical Foundation]\n\u251c\u2500\u2500 [Level 1] Classical Polynomial Models\n\u2502   \u251c\u2500\u2500 1.1 Polynomial Regression\n\u2502   \u251c\u2500\u2500 1.2 Polynomial Kernel Methods\n\u2502   \u2514\u2500\u2500 1.3 Response Surface Methodology (RSM)\n\u2502\n\u251c\u2500\u2500 [Level 2] Orthogonal Polynomial Basis Models\n\u2502   \u251c\u2500\u2500 Group 2-A: Theory-based Orthogonal Polynomials\n\u2502   \u2502   \u251c\u2500\u2500 2.1 Spatial-domain (Zernike \/ Chebyshev \/ Legendre \/ Fourier-Bessel)\n\u2502   \u2502   \u251c\u2500\u2500 2.2 Probabilistic-domain \u2014 Wiener-Askey (Hermite \/ Laguerre \/ Jacobi \/ Gegenbauer)\n\u2502   \u2502   \u2514\u2500\u2500 2.3 Discrete-domain (Charlier \/ Krawtchouk \/ Meixner \/ Hahn)\n\u2502   \u251c\u2500\u2500 Group 2-B: Learning Frameworks Using Orthogonal Polynomials\n\u2502   \u2502   \u251c\u2500\u2500 2.4 Polynomial Chaos Expansion (PCE)\n\u2502   \u2502   \u251c\u2500\u2500 2.5 Sparse PCE & LARS-PCE\n\u2502   \u2502   \u2514\u2500\u2500 2.6 Arbitrary PCE (aPCE)\n\u2502   \u2514\u2500\u2500 Group 2-C: Data-driven Orthogonal Bases\n\u2502       \u2514\u2500\u2500 2.7 Karhunen-Lo\u00e8ve (KL) Expansion \/ Proper Orthogonal Decomposition (POD)\n\u2502\n[Axis B: Model Architecture]\n\u251c\u2500\u2500 [Level 3] Polynomial Neural Architectures\n\u2502   \u251c\u2500\u2500 3.1 Group Method of Data Handling (GMDH)\n\u2502   \u251c\u2500\u2500 3.2 Modern Polynomial Neural Networks (PNN)\n\u2502   \u251c\u2500\u2500 3.3 Pi-Nets\n\u2502   \u251c\u2500\u2500 3.4 Self-Organizing Polynomial NN (SOPNN)\n\u2502   \u2514\u2500\u2500 3.5 Kolmogorov-Arnold Networks (KAN)\n\u2502\n\u251c\u2500\u2500 [Level 4] Tensor & Factorization-based Polynomial Models\n\u2502   \u251c\u2500\u2500 4.1 Factorization Machines (FM)\n\u2502   \u251c\u2500\u2500 4.2 Higher-Order FM (HOFM)\n\u2502   \u251c\u2500\u2500 4.3 Tensor Train \/ Tensor Regression\n\u2502   \u2514\u2500\u2500 4.4 Polynomial Tensor Decomposition\n\u2502\n[Axis C: Application Pattern]\n\u251c\u2500\u2500 [Level 5] Hybrid & Surrogate Modeling\n\u2502   \u251c\u2500\u2500 5.1 PCE-Kriging\n\u2502   \u251c\u2500\u2500 5.2 Global + Residual Models (Spline \/ GNN \/ CNN)\n\u2502   \u251c\u2500\u2500 5.3 Physics-Informed Polynomial Models\n\u2502   \u2514\u2500\u2500 5.4 Multi-fidelity Polynomial Surrogates\n\u2502\n\u2514\u2500\u2500 [Level 6] Symbolic & Sparse Polynomial Discovery\n    \u251c\u2500\u2500 6.1 Sparse Identification of Nonlinear Dynamics (SINDy)\n    \u251c\u2500\u2500 6.2 Symbolic Regression with Polynomial Basis\n    \u2514\u2500\u2500 6.3 LASSO \/ Elastic-Net Polynomial Feature Selection\n<\/pre>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 1. Classical Polynomial Models [Axis A]<\/h2>\n\n\n<style>.kadence-column6615_68fd51-bb > .kt-inside-inner-col,.kadence-column6615_68fd51-bb > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_68fd51-bb > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_68fd51-bb > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_68fd51-bb > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_68fd51-bb > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_68fd51-bb{position:relative;}.kadence-column6615_68fd51-bb, .kt-inside-inner-col > .kadence-column6615_68fd51-bb:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_68fd51-bb > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_68fd51-bb > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_68fd51-bb\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The most fundamental layer, where linear models are extended directly using a power basis ($1, x, x^2, \\ldots$). No orthogonality constraint applies.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">1.1 Polynomial Regression<\/h3>\n\n\n<style>.kadence-column6615_3b2979-2a > .kt-inside-inner-col,.kadence-column6615_3b2979-2a > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_3b2979-2a > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_3b2979-2a > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_3b2979-2a > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_3b2979-2a > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_3b2979-2a{position:relative;}.kadence-column6615_3b2979-2a, .kt-inside-inner-col > .kadence-column6615_3b2979-2a:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_3b2979-2a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_3b2979-2a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_3b2979-2a\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A monomial-basis regression of the form $y = \\beta_0 + \\beta_1 x + \\beta_2 x^2 + \\cdots + \\beta_d x^d + \\epsilon$. As the degree increases, multicollinearity becomes severe, so it is standard practice to combine it with regularization such as Ridge or Least Absolute Shrinkage and Selection Operator (LASSO).<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">1.2 Polynomial Kernel Methods<\/h3>\n\n\n<style>.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col,.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_fd7dcd-37{position:relative;}.kadence-column6615_fd7dcd-37, .kt-inside-inner-col > .kadence-column6615_fd7dcd-37:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_fd7dcd-37 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_fd7dcd-37\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The kernel $K(x, y) = (x^T y + c)^d$ enables computation of inner products in a polynomial feature space without explicit high-dimensional mapping. It is used in Support Vector Machines (SVM), Kernel Ridge Regression, and Kernel Principal Component Analysis (Kernel PCA).<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">1.3 Response Surface Methodology (RSM)<\/h3>\n\n\n<style>.kadence-column6615_92a838-6b > .kt-inside-inner-col,.kadence-column6615_92a838-6b > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_92a838-6b > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_92a838-6b > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_92a838-6b > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_92a838-6b > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_92a838-6b{position:relative;}.kadence-column6615_92a838-6b, .kt-inside-inner-col > .kadence-column6615_92a838-6b:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_92a838-6b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_92a838-6b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_92a838-6b\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A second-order polynomial model $y = \\beta_0 + \\sum \\beta_i x_i + \\sum \\beta_{ii} x_i^2 + \\sum \\beta_{ij} x_i x_j$ is used to find process optima. Combined with Central Composite Design (CCD) and Box-Behnken Design, it serves as a de facto standard for recipe optimization in etch, deposition, and Chemical Mechanical Planarization (CMP) processes (Myers et al. 2016).<\/p>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 2. Orthogonal Polynomial Basis Models [Axis A]<\/h2>\n\n\n<style>.kadence-column6615_744369-44 > .kt-inside-inner-col,.kadence-column6615_744369-44 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_744369-44 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_744369-44 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_744369-44 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_744369-44 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_744369-44{position:relative;}.kadence-column6615_744369-44, .kt-inside-inner-col > .kadence-column6615_744369-44:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_744369-44 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_744369-44 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_744369-44\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Level 2 introduces the constraint of <strong>orthogonality<\/strong> on top of Level 1 to gain stability and interpretability in coefficient estimation. Two polynomials $\\phi_i, \\phi_j$ are orthogonal under a weight function $w(x)$ if<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$\\int_a^b \\phi_i(x)\\,\\phi_j(x)\\,w(x)\\,dx = 0, \\quad i \\neq j$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003Benefits gained by exploiting orthogonality include: (i) coefficients can be estimated independently via orthogonal projection; (ii) adding higher-order terms does not perturb existing coefficients; (iii) output variance decomposes additively, enabling direct sensitivity analysis such as Sobol indices (see Appendix A); and (iv) the regression matrix is well-conditioned. A general treatment of orthogonal polynomials is given in Appendix B.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003The seven sub-items are organized along two sub-axes: <strong>(A) the source of the basis functions<\/strong> (analytically defined vs. data-driven) and <strong>(B) the type of domain<\/strong> (spatial \/ probabilistic \/ discrete).<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Group<\/th><th>Domain<\/th><th>Items<\/th><\/tr><\/thead><tbody><tr><td><strong>2-A: Theory-based<\/strong><\/td><td>Spatial<\/td><td>2.1 <mark style=\"background-color:#ffe200\" class=\"has-inline-color\">Zernike<\/mark> \/ Chebyshev \/ Legendre \/ Fourier-Bessel<\/td><\/tr><tr><td><\/td><td>Probabilistic<\/td><td>2.2 Wiener-Askey (Hermite \/ Laguerre \/ Jacobi \/ Gegenbauer)<\/td><\/tr><tr><td><\/td><td>Discrete lattice<\/td><td>2.3 Charlier \/ Krawtchouk \/ Meixner \/ Hahn<\/td><\/tr><tr><td><strong>2-B: Learning frameworks<\/strong><\/td><td>Stochastic input \u2192 output regression<\/td><td>2.4 PCE \/ 2.5 Sparse PCE \/ 2.6 aPCE<\/td><\/tr><tr><td><strong>2-C: Data-driven bases<\/strong><\/td><td>Measurement data<\/td><td>2.7 KL Expansion \/ POD<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">2.1 Spatial-domain Orthogonal Polynomials<\/h3>\n\n\n<style>.kadence-column6615_49666c-d4 > .kt-inside-inner-col,.kadence-column6615_49666c-d4 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_49666c-d4 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_49666c-d4 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_49666c-d4 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_49666c-d4 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_49666c-d4{position:relative;}.kadence-column6615_49666c-d4, .kt-inside-inner-col > .kadence-column6615_49666c-d4:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_49666c-d4 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_49666c-d4 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_49666c-d4\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003These polynomials are orthogonal on a specific geometric domain such as a wafer or die. They are used to decompose measured spatial data into global patterns.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Polynomial<\/th><th>Domain<\/th><th>Strength<\/th><th>Process Variation Use Case<\/th><\/tr><\/thead><tbody><tr><td><strong>Zernike<\/strong><\/td><td>Circle<\/td><td>Aligns with optical aberration orthogonality<\/td><td>Wafer-level Warp\/Bow, global thickness and overlay decomposition<\/td><\/tr><tr><td><strong>Chebyshev<\/strong><\/td><td>Square<\/td><td>Suppresses Runge phenomenon, minimax approximation<\/td><td>Scanner slit area, intra-die pattern variation<\/td><\/tr><tr><td><strong>Legendre<\/strong><\/td><td>Square \/ interval<\/td><td>Simple integration, center-weighted<\/td><td>Flatness\/roughness variation, linear trend separation<\/td><\/tr><tr><td><strong>Fourier-Bessel<\/strong><\/td><td>Circle<\/td><td>Stable at the edge, captures high-frequency content<\/td><td>Wafer edge roll-off, post-CMP edge zone<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.2 Probabilistic-domain Orthogonal Polynomials (Wiener-Askey Mapping)<\/h3>\n\n\n<style>.kadence-column6615_82d997-b5 > .kt-inside-inner-col,.kadence-column6615_82d997-b5 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_82d997-b5 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_82d997-b5 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_82d997-b5 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_82d997-b5 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_82d997-b5{position:relative;}.kadence-column6615_82d997-b5, .kt-inside-inner-col > .kadence-column6615_82d997-b5:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_82d997-b5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_82d997-b5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_82d997-b5\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003When the input is a random variable, the orthogonal polynomial is selected so that its weight function matches the Probability Density Function (PDF) of that distribution. Xiu &amp; Karniadakis (2002) extended the original Hermite-Gaussian pairing of PCE to the entire Askey scheme, providing a one-to-one mapping between distributions and orthogonal families. This report refers to that mapping as the <em>Wiener-Askey mapping<\/em>.<\/p>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Polynomial<\/th><th>Interval \/ Weight<\/th><th>Corresponding Distribution<\/th><\/tr><\/thead><tbody><tr><td><strong>Hermite<\/strong><\/td><td>$(-\\infty, \\infty)$, $e^{-x^2\/2}$<\/td><td>Gaussian<\/td><\/tr><tr><td><strong>Laguerre<\/strong><\/td><td>$[0, \\infty)$, $e^{-x}$<\/td><td>Gamma \/ Exponential<\/td><\/tr><tr><td><strong>Jacobi<\/strong><\/td><td>$[-1, 1]$, $(1-x)^\\alpha(1+x)^\\beta$<\/td><td>Beta<\/td><\/tr><tr><td><strong>Gegenbauer<\/strong><\/td><td>$[-1, 1]$, $(1-x^2)^{\\alpha-1\/2}$<\/td><td>Special case of Beta<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.3 Discrete-domain Orthogonal Polynomials<\/h3>\n\n\n<style>.kadence-column6615_7e055f-54 > .kt-inside-inner-col,.kadence-column6615_7e055f-54 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_7e055f-54 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_7e055f-54 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_7e055f-54 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_7e055f-54 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_7e055f-54{position:relative;}.kadence-column6615_7e055f-54, .kt-inside-inner-col > .kadence-column6615_7e055f-54:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_7e055f-54 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_7e055f-54 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_7e055f-54\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003These are families orthogonal on integer lattices, suitable for discrete inputs such as defect counts.<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Charlier<\/strong>: Poisson distribution<\/li>\n\n\n\n<li><strong>Krawtchouk<\/strong>: Binomial distribution<\/li>\n\n\n\n<li><strong>Meixner<\/strong>: Negative Binomial distribution<\/li>\n\n\n\n<li><strong>Hahn<\/strong>: Hypergeometric distribution<\/li>\n<\/ul>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.4 Polynomial Chaos Expansion (PCE)<\/h3>\n\n\n<style>.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col,.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_7ff6b9-1f{position:relative;}.kadence-column6615_7ff6b9-1f, .kt-inside-inner-col > .kadence-column6615_7ff6b9-1f:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_7ff6b9-1f > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_7ff6b9-1f\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003PCE expands the response of a system with stochastic inputs as a series of orthogonal polynomials (Ghanem &amp; Spanos 1991; Xiu &amp; Karniadakis 2002).<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$Y = \\sum_{\\alpha \\in \\mathcal{A}} c_\\alpha\\, \\Psi_\\alpha(\\xi)$$\n<\/div>\n\n\n\n<figure class=\"wp-block-table\"><table><thead><tr><th>Symbol<\/th><th>Meaning<\/th><\/tr><\/thead><tbody><tr><td>$Y$<\/td><td>System output (scalar or vector), e.g., wafer thickness, critical dimension<\/td><\/tr><tr><td>$\\xi = (\\xi_1, \\ldots, \\xi_d)$<\/td><td>Standardized stochastic input vector, each $\\xi_i$ following a known distribution<\/td><\/tr><tr><td>$d$<\/td><td>Number of stochastic input variables<\/td><\/tr><tr><td>$\\alpha = (\\alpha_1, \\ldots, \\alpha_d)$<\/td><td>Multi-index, $\\alpha_i \\in \\mathbb{N}_0$, indicating the polynomial degree per input<\/td><\/tr><tr><td>$\\mathcal{A}$<\/td><td>Set of multi-indices used (typically $\\sum_i \\alpha_i \\leq p$)<\/td><\/tr><tr><td>$\\Psi_\\alpha(\\xi)$<\/td><td>Product of univariate orthogonal polynomials: $\\prod_{i=1}^d \\psi_{\\alpha_i}(\\xi_i)$<\/td><\/tr><tr><td>$c_\\alpha$<\/td><td>Polynomial coefficient (target of learning)<\/td><\/tr><tr><td>$p$<\/td><td>Truncation order of the expansion<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003Thanks to orthogonality, Sobol sensitivity indices (see Appendix A) can be obtained analytically from $c_\\alpha$.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.5 Sparse PCE &amp; LARS-PCE<\/h3>\n\n\n<style>.kadence-column6615_f1642b-04 > .kt-inside-inner-col,.kadence-column6615_f1642b-04 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_f1642b-04 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_f1642b-04 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_f1642b-04 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_f1642b-04 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_f1642b-04{position:relative;}.kadence-column6615_f1642b-04, .kt-inside-inner-col > .kadence-column6615_f1642b-04:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_f1642b-04 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_f1642b-04 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_f1642b-04\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003<strong>Why does the term count explode?<\/strong> The number of PCE terms with $d$-dimensional input and total degree up to $p$ is<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$P + 1 = \\binom{d + p}{p} = \\frac{(d+p)!}{d!\\,p!}$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003This counts all integer combinations whose degree-sum is at most $p$, leading to combinatorial explosion. For example: $d=10, p=4 \\Rightarrow 1{,}001$ terms; $d=20, p=4 \\Rightarrow 10{,}626$; $d=50, p=4 \\Rightarrow 316{,}251$. In semiconductor processes with tens to hundreds of inputs, the number of terms quickly exceeds the number of available samples, making naive PCE infeasible.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003The remedy is sparsity. Least Angle Regression (LARS) or Orthogonal Matching Pursuit (OMP) selects only the most important polynomial terms. Adaptive Sparse PCE (Blatman &amp; Sudret 2011) is a representative method.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.6 Arbitrary PCE (aPCE)<\/h3>\n\n\n<style>.kadence-column6615_269883-77 > .kt-inside-inner-col,.kadence-column6615_269883-77 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_269883-77 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_269883-77 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_269883-77 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_269883-77 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_269883-77{position:relative;}.kadence-column6615_269883-77, .kt-inside-inner-col > .kadence-column6615_269883-77:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_269883-77 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_269883-77 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_269883-77\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003When the input distribution is unknown or non-standard, the orthogonal polynomial basis can be constructed directly from the empirical moments of the data (Oladyshkin &amp; Nowak 2012). aPCE is useful for irregular process data where the Wiener-Askey mapping does not apply.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">2.7 Data-driven Orthogonal Bases (KL Expansion \/ POD)<\/h3>\n\n\n<style>.kadence-column6615_6c803b-a2 > .kt-inside-inner-col,.kadence-column6615_6c803b-a2 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_6c803b-a2 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_6c803b-a2 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_6c803b-a2 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_6c803b-a2 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_6c803b-a2{position:relative;}.kadence-column6615_6c803b-a2, .kt-inside-inner-col > .kadence-column6615_6c803b-a2:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_6c803b-a2 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_6c803b-a2 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_6c803b-a2\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Whereas 2.1\u20132.6 use polynomials defined a priori, 2.7 builds the basis directly from the data. The covariance structure of measurements is eigen-decomposed, and the eigenvectors corresponding to the largest eigenvalues serve as an orthogonal basis. Conceptually, the data itself reveals its own dominant variation modes (mode 1, mode 2, mode 3, &#8230;).<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li><strong>Karhunen-Lo\u00e8ve (KL) Expansion<\/strong>: Optimal orthogonal decomposition of a random field; suitable for extracting principal modes of W2W variation (Lo\u00e8ve 1978).<\/li>\n\n\n\n<li><strong>Proper Orthogonal Decomposition (POD)<\/strong>: Discrete and practical version of KL; mathematically equivalent to Principal Component Analysis (PCA).<\/li>\n<\/ul>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 3. Polynomial Neural Architectures [Axis B]<\/h2>\n\n\n<style>.kadence-column6615_470809-45 > .kt-inside-inner-col,.kadence-column6615_470809-45 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_470809-45 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_470809-45 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_470809-45 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_470809-45 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_470809-45{position:relative;}.kadence-column6615_470809-45, .kt-inside-inner-col > .kadence-column6615_470809-45:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_470809-45 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_470809-45 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_470809-45\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Level 3 embeds polynomial combinations (higher-order and interaction terms) inside neuron computations.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">3.1 Group Method of Data Handling (GMDH)<\/h3>\n\n\n<style>.kadence-column6615_e0139c-39 > .kt-inside-inner-col,.kadence-column6615_e0139c-39 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_e0139c-39 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_e0139c-39 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_e0139c-39 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_e0139c-39 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_e0139c-39{position:relative;}.kadence-column6615_e0139c-39, .kt-inside-inner-col > .kadence-column6615_e0139c-39:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_e0139c-39 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_e0139c-39 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_e0139c-39\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The progenitor of Polynomial Neural Networks (PNN) (Ivakhnenko 1971). At each layer, second-order polynomial candidates over variable pairs $(x_i, x_j)$ are generated, and only nodes that pass an external validation criterion advance to the next layer, allowing the network to grow autonomously.<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$y = a_0 + a_1 x_i + a_2 x_j + a_3 x_i x_j + a_4 x_i^2 + a_5 x_j^2$$\n<\/div>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">3.2 Modern Polynomial Neural Networks (PNN)<\/h3>\n\n\n<style>.kadence-column6615_029e83-69 > .kt-inside-inner-col,.kadence-column6615_029e83-69 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_029e83-69 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_029e83-69 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_029e83-69 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_029e83-69 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_029e83-69{position:relative;}.kadence-column6615_029e83-69, .kt-inside-inner-col > .kadence-column6615_029e83-69:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_029e83-69 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_029e83-69 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_029e83-69\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A modern extension of GMDH in which the degree, variable selection, and number of layers are determined adaptively.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">3.3 Pi-Nets<\/h3>\n\n\n<style>.kadence-column6615_92a49b-ca > .kt-inside-inner-col,.kadence-column6615_92a49b-ca > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_92a49b-ca > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_92a49b-ca > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_92a49b-ca > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_92a49b-ca > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_92a49b-ca{position:relative;}.kadence-column6615_92a49b-ca, .kt-inside-inner-col > .kadence-column6615_92a49b-ca:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_92a49b-ca > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_92a49b-ca > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_92a49b-ca\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Pi-Nets (Chrysos et al. 2020) express the output as a higher-order polynomial expansion of the input and use tensor decompositions (CANDECOMP\/PARAFAC, Tucker) to keep parameter counts tractable. They achieve strong expressive power even without activation functions.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">3.4 Self-Organizing Polynomial Neural Networks (SOPNN)<\/h3>\n\n\n<style>.kadence-column6615_aae0a8-92 > .kt-inside-inner-col,.kadence-column6615_aae0a8-92 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_aae0a8-92 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_aae0a8-92 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_aae0a8-92 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_aae0a8-92 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_aae0a8-92{position:relative;}.kadence-column6615_aae0a8-92, .kt-inside-inner-col > .kadence-column6615_aae0a8-92:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_aae0a8-92 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_aae0a8-92 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_aae0a8-92\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003An extension of GMDH (Oh &amp; Pedrycz 2002) that allows partial polynomials of varying degree at each node.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">3.5 Kolmogorov-Arnold Networks (KAN)<\/h3>\n\n\n<style>.kadence-column6615_2e5a88-0a > .kt-inside-inner-col,.kadence-column6615_2e5a88-0a > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_2e5a88-0a > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_2e5a88-0a > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_2e5a88-0a > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_2e5a88-0a > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_2e5a88-0a{position:relative;}.kadence-column6615_2e5a88-0a, .kt-inside-inner-col > .kadence-column6615_2e5a88-0a:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_2e5a88-0a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_2e5a88-0a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_2e5a88-0a\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003KAN (Liu et al. 2024) places learnable univariate functions (B-splines or polynomials) on the edges of the network. Choosing polynomial bases for the edge functions effectively yields a structured generalization of PNN.<\/p>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 4. Tensor &amp; Factorization-based Polynomial Models [Axis B]<\/h2>\n\n\n<style>.kadence-column6615_1c8cea-9d > .kt-inside-inner-col,.kadence-column6615_1c8cea-9d > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_1c8cea-9d > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_1c8cea-9d > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_1c8cea-9d > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_1c8cea-9d > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_1c8cea-9d{position:relative;}.kadence-column6615_1c8cea-9d, .kt-inside-inner-col > .kadence-column6615_1c8cea-9d:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_1c8cea-9d > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_1c8cea-9d > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_1c8cea-9d\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003This level handles higher-order interaction terms efficiently through tensor decomposition.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">4.1 Factorization Machines (FM)<\/h3>\n\n\n<style>.kadence-column6615_c3de9e-ab > .kt-inside-inner-col,.kadence-column6615_c3de9e-ab > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_c3de9e-ab > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_c3de9e-ab > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_c3de9e-ab > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_c3de9e-ab > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_c3de9e-ab{position:relative;}.kadence-column6615_c3de9e-ab, .kt-inside-inner-col > .kadence-column6615_c3de9e-ab:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_c3de9e-ab > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_c3de9e-ab > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_c3de9e-ab\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Factorization Machines (Rendle 2010) represent the interaction weights of a second-order polynomial regression as inner products of low-dimensional latent vectors rather than learning each weight independently.<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$\\hat{y} = w_0 + \\sum_i w_i x_i + \\sum_{i<j} \\langle v_i, v_j \\rangle\\, x_i x_j$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003FM is particularly effective on sparse data such as recommendation systems and click-through-rate prediction.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">4.2 Higher-Order Factorization Machines (HOFM)<\/h3>\n\n\n<style>.kadence-column6615_2a3781-96 > .kt-inside-inner-col,.kadence-column6615_2a3781-96 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_2a3781-96 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_2a3781-96 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_2a3781-96 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_2a3781-96 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_2a3781-96{position:relative;}.kadence-column6615_2a3781-96, .kt-inside-inner-col > .kadence-column6615_2a3781-96:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_2a3781-96 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_2a3781-96 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_2a3781-96\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003HOFM (Blondel et al. 2016) extends FM to third- and fourth-order interactions efficiently using ANOVA kernels.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">4.3 Tensor Train \/ Tensor Regression<\/h3>\n\n\n<style>.kadence-column6615_d56dbd-4f > .kt-inside-inner-col,.kadence-column6615_d56dbd-4f > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_d56dbd-4f > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_d56dbd-4f > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_d56dbd-4f > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_d56dbd-4f > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_d56dbd-4f{position:relative;}.kadence-column6615_d56dbd-4f, .kt-inside-inner-col > .kadence-column6615_d56dbd-4f:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_d56dbd-4f > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_d56dbd-4f > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_d56dbd-4f\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The coefficients of a multivariate polynomial are viewed as a tensor and compressed via Tensor Train (TT) decomposition or Tucker decomposition. <em>Low-rank PCE<\/em> applied to high-dimensional PCE belongs to this category (Konakli &amp; Sudret 2016).<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">4.4 Polynomial Tensor Decomposition<\/h3>\n\n\n<style>.kadence-column6615_474a58-fc > .kt-inside-inner-col,.kadence-column6615_474a58-fc > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_474a58-fc > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_474a58-fc > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_474a58-fc > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_474a58-fc > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_474a58-fc{position:relative;}.kadence-column6615_474a58-fc, .kt-inside-inner-col > .kadence-column6615_474a58-fc:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_474a58-fc > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_474a58-fc > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_474a58-fc\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A formulation that casts tensor decomposition itself in polynomial form.<\/p>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 5. Hybrid &amp; Surrogate Modeling [Axis C]<\/h2>\n\n\n<style>.kadence-column6615_9b5829-c1 > .kt-inside-inner-col,.kadence-column6615_9b5829-c1 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_9b5829-c1 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_9b5829-c1 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_9b5829-c1 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_9b5829-c1 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_9b5829-c1{position:relative;}.kadence-column6615_9b5829-c1, .kt-inside-inner-col > .kadence-column6615_9b5829-c1:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_9b5829-c1 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_9b5829-c1 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_9b5829-c1\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Level 5 combines different polynomial techniques, or polynomial models with non-polynomial models, to maximize expressive power.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">5.1 PCE-Kriging<\/h3>\n\n\n<style>.kadence-column6615_06de4c-b0 > .kt-inside-inner-col,.kadence-column6615_06de4c-b0 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_06de4c-b0 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_06de4c-b0 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_06de4c-b0 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_06de4c-b0 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_06de4c-b0{position:relative;}.kadence-column6615_06de4c-b0, .kt-inside-inner-col > .kadence-column6615_06de4c-b0:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_06de4c-b0 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_06de4c-b0 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_06de4c-b0\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003PC-Kriging (Sch\u00f6bi et al. 2015) captures global trends with PCE and models the residual as a Gaussian Process (GP). It is a standard paradigm in virtual metrology.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">5.2 Global + Residual Models<\/h3>\n\n\n<style>.kadence-column6615_4a450f-3b > .kt-inside-inner-col,.kadence-column6615_4a450f-3b > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_4a450f-3b > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_4a450f-3b > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_4a450f-3b > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_4a450f-3b > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_4a450f-3b{position:relative;}.kadence-column6615_4a450f-3b, .kt-inside-inner-col > .kadence-column6615_4a450f-3b:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_4a450f-3b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_4a450f-3b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_4a450f-3b\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Low-order orthogonal polynomials (e.g., Zernike) capture global shape, while a Spline (notably the Thin Plate Spline), Graph Neural Network (GNN), or Convolutional Neural Network (CNN) learns the fine-scale residual. This hybrid is effective for local distortions such as those caused by chuck adsorption.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">5.3 Physics-Informed Polynomial Models<\/h3>\n\n\n<style>.kadence-column6615_070226-c2 > .kt-inside-inner-col,.kadence-column6615_070226-c2 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_070226-c2 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_070226-c2 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_070226-c2 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_070226-c2 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_070226-c2{position:relative;}.kadence-column6615_070226-c2, .kt-inside-inner-col > .kadence-column6615_070226-c2:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_070226-c2 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_070226-c2 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_070226-c2\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A polynomial variant of Physics-Informed Neural Networks (PINN) (Raissi et al. 2019). Governing equations are included in the loss function, and the solution is expanded in a polynomial basis (typically Chebyshev or Legendre); this construction is referred to as a <em>Spectral PINN<\/em>.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">5.4 Multi-fidelity Polynomial Surrogates<\/h3>\n\n\n<style>.kadence-column6615_96a333-88 > .kt-inside-inner-col,.kadence-column6615_96a333-88 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_96a333-88 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_96a333-88 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_96a333-88 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_96a333-88 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_96a333-88{position:relative;}.kadence-column6615_96a333-88, .kt-inside-inner-col > .kadence-column6615_96a333-88:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_96a333-88 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_96a333-88 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_96a333-88\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Combines low-fidelity (fast simulation) and high-fidelity (measurement) data (Kennedy &amp; O&#8217;Hagan 2000). It is essential for virtual metrology that fuses Technology Computer-Aided Design (TCAD) simulations with measurements.<\/p>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Level 6. Symbolic &amp; Sparse Polynomial Discovery [Axis C]<\/h2>\n\n\n<style>.kadence-column6615_455fac-8b > .kt-inside-inner-col,.kadence-column6615_455fac-8b > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_455fac-8b > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_455fac-8b > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_455fac-8b > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_455fac-8b > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_455fac-8b{position:relative;}.kadence-column6615_455fac-8b, .kt-inside-inner-col > .kadence-column6615_455fac-8b:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_455fac-8b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_455fac-8b > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_455fac-8b\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003The most recent direction: discovering interpretable polynomial expressions directly from data.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">6.1 Sparse Identification of Nonlinear Dynamics (SINDy)<\/h3>\n\n\n<style>.kadence-column6615_30e1b8-ac > .kt-inside-inner-col,.kadence-column6615_30e1b8-ac > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_30e1b8-ac > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_30e1b8-ac > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_30e1b8-ac > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_30e1b8-ac > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_30e1b8-ac{position:relative;}.kadence-column6615_30e1b8-ac, .kt-inside-inner-col > .kadence-column6615_30e1b8-ac:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_30e1b8-ac > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_30e1b8-ac > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_30e1b8-ac\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003SINDy (Brunton et al. 2016) builds a library matrix from candidate functions (polynomials, trigonometric terms, etc.) and applies LASSO to recover a sparse solution, thereby identifying the governing equations of a dynamical system.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">6.2 Symbolic Regression with Polynomial Basis<\/h3>\n\n\n<style>.kadence-column6615_a02068-18 > .kt-inside-inner-col,.kadence-column6615_a02068-18 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_a02068-18 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_a02068-18 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_a02068-18 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_a02068-18 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_a02068-18{position:relative;}.kadence-column6615_a02068-18, .kt-inside-inner-col > .kadence-column6615_a02068-18:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_a02068-18 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_a02068-18 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_a02068-18\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Tools based on Genetic Programming (GP), such as PySR (Cranmer 2023), use polynomial terms as building blocks and search over expressions.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">6.3 LASSO \/ Elastic-Net Polynomial Feature Selection<\/h3>\n\n\n<style>.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col,.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_c9a8cf-e1{position:relative;}.kadence-column6615_c9a8cf-e1, .kt-inside-inner-col > .kadence-column6615_c9a8cf-e1:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_c9a8cf-e1 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_c9a8cf-e1\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003A classical approach: a large number of polynomial features are generated and then pruned via regularization (Tibshirani 1996; Zou &amp; Hastie 2005).<\/p>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Mapping to Wafer Process Variation Modeling (WiW \/ W2W)<\/h2>\n\n\n<style>.kadence-column6615_395b69-b3 > .kt-inside-inner-col,.kadence-column6615_395b69-b3 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_395b69-b3 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_395b69-b3 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_395b69-b3 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_395b69-b3 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_395b69-b3{position:relative;}.kadence-column6615_395b69-b3, .kt-inside-inner-col > .kadence-column6615_395b69-b3:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_395b69-b3 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_395b69-b3 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_395b69-b3\"><div class=\"kt-inside-inner-col\">\n<figure class=\"wp-block-table\"><table><thead><tr><th>Application<\/th><th>Taxonomy Position<\/th><th>Method<\/th><\/tr><\/thead><tbody><tr><td>WiW spatial decomposition (global shape)<\/td><td>Level 2.1<\/td><td>Zernike \/ Chebyshev \/ Legendre \/ Fourier-Bessel regression<\/td><\/tr><tr><td>WiW spatial decomposition (local residual)<\/td><td>Level 5.2<\/td><td>Global + Spline\/GNN\/CNN residual<\/td><\/tr><tr><td>W2W variation mode extraction<\/td><td>Level 2.7<\/td><td>KL Expansion \/ POD<\/td><\/tr><tr><td>Process variation Uncertainty Quantification (UQ)<\/td><td>Level 2.4, 2.5<\/td><td>PCE \/ Sparse PCE<\/td><\/tr><tr><td>Virtual Metrology<\/td><td>Level 5.1, 5.4<\/td><td>PCE-Kriging, Multi-fidelity surrogate<\/td><\/tr><tr><td>Process recipe optimization (DOE)<\/td><td>Level 1.3<\/td><td>RSM<\/td><\/tr><tr><td>Process dynamics discovery<\/td><td>Level 6.1<\/td><td>SINDy<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n<\/div><\/div>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\" style=\"margin-top:var(--wp--preset--spacing--60);margin-bottom:var(--wp--preset--spacing--60)\"\/>\n\n\n\n<h2 class=\"wp-block-heading\">Appendix A. Sobol Sensitivity Indices<\/h2>\n\n\n<style>.kadence-column6615_94d3a3-ca > .kt-inside-inner-col,.kadence-column6615_94d3a3-ca > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_94d3a3-ca > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_94d3a3-ca > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_94d3a3-ca > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_94d3a3-ca > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_94d3a3-ca{position:relative;}.kadence-column6615_94d3a3-ca, .kt-inside-inner-col > .kadence-column6615_94d3a3-ca:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_94d3a3-ca > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_94d3a3-ca > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_94d3a3-ca\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Sobol indices (Sobol 1993) are a global-sensitivity measure that quantifies how much of the output variance is attributable to each input variable, or to combinations of inputs.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">A.1 ANOVA Decomposition<\/h3>\n\n\n<style>.kadence-column6615_cf4320-04 > .kt-inside-inner-col,.kadence-column6615_cf4320-04 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_cf4320-04 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_cf4320-04 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_cf4320-04 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_cf4320-04 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_cf4320-04{position:relative;}.kadence-column6615_cf4320-04, .kt-inside-inner-col > .kadence-column6615_cf4320-04:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_cf4320-04 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_cf4320-04 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_cf4320-04\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Suppose $Y = f(X_1, X_2, \\ldots, X_d)$ admits the Analysis of Variance (ANOVA) decomposition<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$f(X) = f_0 + \\sum_i f_i(X_i) + \\sum_{i \\lt j} f_{ij}(X_i, X_j) + \\cdots + f_{1,2,\\ldots,d}(X_1, \\ldots, X_d)$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003If the components are mutually orthogonal (independent), the output variance decomposes as $\\mathrm{Var}(Y) = \\sum_i V_i + \\sum_{i \\lt j} V_{ij} + \\cdots$, where $V_i = \\mathrm{Var}(f_i(X_i))$ is the contribution of $X_i$ alone and $V_{ij}$ captures the interaction between $X_i$ and $X_j$.<j} v_{ij}=\"\" +=\"\" \\cdots$,=\"\" where=\"\" $v_i=\"\\mathrm{Var}(f_i(X_i))$\" is=\"\" the=\"\" contribution=\"\" of=\"\" $x_i$=\"\" alone=\"\" and=\"\" $v_{ij}$=\"\" captures=\"\" interaction=\"\" between=\"\" $x_j$.<=\"\" p=\"\"><\/j}><\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">A.2 First-order and Total-effect Indices<\/h3>\n\n\n<style>.kadence-column6615_541830-e0 > .kt-inside-inner-col,.kadence-column6615_541830-e0 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_541830-e0 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_541830-e0 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_541830-e0 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_541830-e0 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_541830-e0{position:relative;}.kadence-column6615_541830-e0, .kt-inside-inner-col > .kadence-column6615_541830-e0:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_541830-e0 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_541830-e0 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_541830-e0\"><div class=\"kt-inside-inner-col\">\n<div style=\"background-color: #fff; border: none\">\n$$S_i = \\frac{V_i}{\\mathrm{Var}(Y)}, \\qquad S_i^T = 1 &#8211; \\frac{\\mathrm{Var}(\\mathbb{E}[Y \\mid X_{\\sim i}])}{\\mathrm{Var}(Y)}$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003$S_i$ is the contribution of $X_i$ acting alone, while the total-effect index $S_i^T$ is the total contribution of $X_i$ including all its interactions.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">A.3 Closed-form Computation in PCE<\/h3>\n\n\n<style>.kadence-column6615_20cf84-f8 > .kt-inside-inner-col,.kadence-column6615_20cf84-f8 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_20cf84-f8 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_20cf84-f8 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_20cf84-f8 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_20cf84-f8 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_20cf84-f8{position:relative;}.kadence-column6615_20cf84-f8, .kt-inside-inner-col > .kadence-column6615_20cf84-f8:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_20cf84-f8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_20cf84-f8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_20cf84-f8\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003In a PCE $Y = \\sum_\\alpha c_\\alpha \\Psi_\\alpha(\\xi)$, orthogonality makes the variance a simple sum:<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$\\mathrm{Var}(Y) = \\sum_{\\alpha \\neq 0} c_\\alpha^2\\, \\mathbb{E}[\\Psi_\\alpha^2]$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003Letting $\\mathcal{A}_i = \\{\\alpha : \\alpha_i &gt; 0,\\ \\alpha_j = 0\\ \\forall j \\neq i\\}$, we have<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$S_i = \\frac{\\sum_{\\alpha \\in \\mathcal{A}_i} c_\\alpha^2\\, \\mathbb{E}[\\Psi_\\alpha^2]}{\\sum_{\\alpha \\neq 0} c_\\alpha^2\\, \\mathbb{E}[\\Psi_\\alpha^2]}$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003All Sobol indices follow in closed form from the PCE coefficients alone, with no additional simulation required. This property (Sudret 2008) is the central reason PCE has become a standard in UQ.<\/p>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">Appendix B. Orthogonal Polynomials<\/h2>\n\n\n\n<h3 class=\"wp-block-heading\">B.1 Definition<\/h3>\n\n\n<style>.kadence-column6615_41d6bf-33 > .kt-inside-inner-col,.kadence-column6615_41d6bf-33 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_41d6bf-33 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_41d6bf-33 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_41d6bf-33 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_41d6bf-33 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_41d6bf-33{position:relative;}.kadence-column6615_41d6bf-33, .kt-inside-inner-col > .kadence-column6615_41d6bf-33:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_41d6bf-33 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_41d6bf-33 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_41d6bf-33\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003Given an interval $[a, b]$ and a non-negative weight $w(x)$, a sequence $\\{\\phi_0, \\phi_1, \\phi_2, \\ldots\\}$ of polynomials is called an orthogonal polynomial sequence with respect to $w(x)$ if<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$\\langle \\phi_i, \\phi_j \\rangle_w := \\int_a^b \\phi_i(x)\\,\\phi_j(x)\\,w(x)\\,dx = h_i\\,\\delta_{ij}$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003where $h_i &gt; 0$ are normalization constants and $\\delta_{ij}$ is the Kronecker delta. If $h_i = 1$, the system is orthonormal.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">B.2 Key Properties<\/h3>\n\n\n<style>.kadence-column6615_a1c835-8e > .kt-inside-inner-col,.kadence-column6615_a1c835-8e > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_a1c835-8e > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_a1c835-8e > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_a1c835-8e > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_a1c835-8e > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_a1c835-8e{position:relative;}.kadence-column6615_a1c835-8e, .kt-inside-inner-col > .kadence-column6615_a1c835-8e:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_a1c835-8e > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_a1c835-8e > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_a1c835-8e\"><div class=\"kt-inside-inner-col\">\n<p class=\"wp-block-paragraph\">\u2003<strong>(1) Three-term recurrence.<\/strong> Every orthogonal polynomial system satisfies a recurrence of the form<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$\\phi_{n+1}(x) = (A_n x + B_n)\\,\\phi_n(x) &#8211; C_n\\,\\phi_{n-1}(x)$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003which makes evaluation numerically stable and efficient.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003<strong>(2) Distribution of zeros.<\/strong> $\\phi_n(x)$ has exactly $n$ simple real zeros inside $[a, b]$, which serve as the nodes of Gaussian quadrature.<\/p>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003<strong>(3) Best approximation.<\/strong> In the $L^2_w$ norm, the best polynomial approximation of $f$ of degree at most $n$ is<\/p>\n\n\n\n<div style=\"background-color: #fff; border: none\">\n$$f_n^*(x) = \\sum_{k=0}^n \\frac{\\langle f, \\phi_k \\rangle_w}{h_k}\\,\\phi_k(x)$$\n<\/div>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003each coefficient determined independently of the others \u2014 the orthogonal projection.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">B.3 Representative Polynomials<\/h3>\n\n\n<style>.kadence-column6615_852fe2-56 > .kt-inside-inner-col,.kadence-column6615_852fe2-56 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_852fe2-56 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_852fe2-56 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_852fe2-56 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_852fe2-56 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_852fe2-56{position:relative;}.kadence-column6615_852fe2-56, .kt-inside-inner-col > .kadence-column6615_852fe2-56:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_852fe2-56 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_852fe2-56 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_852fe2-56\"><div class=\"kt-inside-inner-col\">\n<figure class=\"wp-block-table\"><table><thead><tr><th>Name<\/th><th>Interval $[a,b]$<\/th><th>Weight $w(x)$<\/th><th>Initial Recurrence<\/th><\/tr><\/thead><tbody><tr><td>Legendre $P_n$<\/td><td>$[-1, 1]$<\/td><td>$1$<\/td><td>$P_0=1, P_1=x$<\/td><\/tr><tr><td>Chebyshev (1st kind) $T_n$<\/td><td>$[-1, 1]$<\/td><td>$(1-x^2)^{-1\/2}$<\/td><td>$T_0=1, T_1=x$<\/td><\/tr><tr><td>Hermite $H_n$ (probabilists&#8217;)<\/td><td>$(-\\infty, \\infty)$<\/td><td>$e^{-x^2\/2}$<\/td><td>$H_0=1, H_1=x$<\/td><\/tr><tr><td>Laguerre $L_n$<\/td><td>$[0, \\infty)$<\/td><td>$e^{-x}$<\/td><td>$L_0=1, L_1=1-x$<\/td><\/tr><tr><td>Jacobi $P_n^{(\\alpha,\\beta)}$<\/td><td>$[-1, 1]$<\/td><td>$(1-x)^\\alpha(1+x)^\\beta$<\/td><td>$P_0=1$<\/td><\/tr><tr><td>Zernike $Z_n^m(r,\\theta)$<\/td><td>Unit disk<\/td><td>$1$<\/td><td>2D, separable in radius and angle<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">B.4 Wiener-Askey Mapping (Distribution \u2194 Orthogonal Polynomial)<\/h3>\n\n\n<style>.kadence-column6615_18e949-05 > .kt-inside-inner-col,.kadence-column6615_18e949-05 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_18e949-05 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_18e949-05 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_18e949-05 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_18e949-05 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_18e949-05{position:relative;}.kadence-column6615_18e949-05, .kt-inside-inner-col > .kadence-column6615_18e949-05:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_18e949-05 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_18e949-05 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_18e949-05\"><div class=\"kt-inside-inner-col\">\n<figure class=\"wp-block-table\"><table><thead><tr><th>Distribution<\/th><th>Weight = PDF<\/th><th>Orthogonal Polynomial<\/th><\/tr><\/thead><tbody><tr><td>Gaussian<\/td><td>$\\propto e^{-x^2\/2}$<\/td><td>Hermite<\/td><\/tr><tr><td>Uniform on $[-1,1]$<\/td><td>$1\/2$<\/td><td>Legendre<\/td><\/tr><tr><td>Gamma \/ Exponential<\/td><td>$\\propto e^{-x}$<\/td><td>Laguerre<\/td><\/tr><tr><td>Beta<\/td><td>$\\propto (1-x)^\\alpha(1+x)^\\beta$<\/td><td>Jacobi<\/td><\/tr><tr><td>Poisson<\/td><td>discrete<\/td><td>Charlier<\/td><\/tr><tr><td>Binomial<\/td><td>discrete<\/td><td>Krawtchouk<\/td><\/tr><\/tbody><\/table><\/figure>\n\n\n\n<p class=\"wp-block-paragraph\">\u2003This mapping (Xiu &amp; Karniadakis 2002) is the basis on which PCE automatically chooses the orthogonal polynomial family that matches the input distribution.<\/p>\n<\/div><\/div>\n\n\n\n<h3 class=\"wp-block-heading\">B.5 Why Orthogonal Polynomials Are Powerful in PML<\/h3>\n\n\n<style>.kadence-column6615_63d16a-11 > .kt-inside-inner-col,.kadence-column6615_63d16a-11 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_63d16a-11 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_63d16a-11 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_63d16a-11 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_63d16a-11 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_63d16a-11{position:relative;}.kadence-column6615_63d16a-11, .kt-inside-inner-col > .kadence-column6615_63d16a-11:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_63d16a-11 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_63d16a-11 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_63d16a-11\"><div class=\"kt-inside-inner-col\">\n<ul class=\"wp-block-list\">\n<li><strong>Numerical stability<\/strong>: The monomial basis $\\{1, x, x^2, \\ldots\\}$ becomes nearly parallel on $[0,1]$, producing an ill-conditioned Vandermonde regression matrix. Orthogonal bases avoid this.<\/li>\n\n\n\n<li><strong>Coefficient interpretability<\/strong>: Each coefficient directly represents the strength of its corresponding polynomial mode.<\/li>\n\n\n\n<li><strong>Modularity in adding terms<\/strong>: Adding higher-order terms does not alter existing coefficients, enabling adaptive modeling.<\/li>\n\n\n\n<li><strong>Variance decomposition<\/strong>: ANOVA-style decomposition follows automatically \u2014 Sobol indices and sensitivity analysis become direct.<\/li>\n\n\n\n<li><strong>Compatibility with Gaussian quadrature<\/strong>: The zeros of the polynomials serve as quadrature nodes, making integrals and expectations efficient.<\/li>\n<\/ul>\n<\/div><\/div>\n\n\n\n<h2 class=\"wp-block-heading\">References<\/h2>\n\n\n<style>.kadence-column6615_30f32d-e8 > .kt-inside-inner-col,.kadence-column6615_30f32d-e8 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column6615_30f32d-e8 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column6615_30f32d-e8 > .kt-inside-inner-col{flex-direction:column;}.kadence-column6615_30f32d-e8 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column6615_30f32d-e8 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column6615_30f32d-e8{position:relative;}.kadence-column6615_30f32d-e8, .kt-inside-inner-col > .kadence-column6615_30f32d-e8:not(.specificity){margin-left:var(--global-kb-spacing-sm, 1.5rem);}@media all and (max-width: 1024px){.kadence-column6615_30f32d-e8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column6615_30f32d-e8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column6615_30f32d-e8\"><div class=\"kt-inside-inner-col\">\n<ul class=\"wp-block-list\">\n<li>Blatman, G., &amp; Sudret, B. (2011). Adaptive sparse polynomial chaos expansion based on least angle regression. <em>Journal of Computational Physics<\/em>, 230(6), 2345\u20132367.<\/li>\n\n\n\n<li>Blondel, M., Fujino, A., Ueda, N., &amp; Ishihata, M. (2016). Higher-order factorization machines. <em>Advances in Neural Information Processing Systems<\/em>, 29.<\/li>\n\n\n\n<li>Brunton, S. L., Proctor, J. L., &amp; Kutz, J. N. (2016). Discovering governing equations from data by sparse identification of nonlinear dynamical systems. <em>Proceedings of the National Academy of Sciences<\/em>, 113(15), 3932\u20133937.<\/li>\n\n\n\n<li>Chrysos, G. G., Moschoglou, S., Bouritsas, G., Panagakis, Y., Deng, J., &amp; Zafeiriou, S. (2020). P-Nets: Deep polynomial neural networks. <em>IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)<\/em>.<\/li>\n\n\n\n<li>Cranmer, M. (2023). Interpretable machine learning for science with PySR and SymbolicRegression.jl. <em>arXiv preprint arXiv:2305.01582<\/em>.<\/li>\n\n\n\n<li>Ghanem, R. G., &amp; Spanos, P. D. (1991). <em>Stochastic Finite Elements: A Spectral Approach<\/em>. Springer.<\/li>\n\n\n\n<li>Ivakhnenko, A. G. (1971). Polynomial theory of complex systems. <em>IEEE Transactions on Systems, Man, and Cybernetics<\/em>, SMC-1(4), 364\u2013378.<\/li>\n\n\n\n<li>Kennedy, M. C., &amp; O&#8217;Hagan, A. (2000). Predicting the output from a complex computer code when fast approximations are available. <em>Biometrika<\/em>, 87(1), 1\u201313.<\/li>\n\n\n\n<li>Konakli, K., &amp; Sudret, B. (2016). Polynomial meta-models with canonical low-rank approximations: Numerical insights and comparison to sparse polynomial chaos expansions. <em>Journal of Computational Physics<\/em>, 321, 1144\u20131169.<\/li>\n\n\n\n<li>Liu, Z., Wang, Y., Vaidya, S., Ruehle, F., Halverson, J., Solja\u010di\u0107, M., Hou, T. Y., &amp; Tegmark, M. (2024). KAN: Kolmogorov-Arnold networks. <em>arXiv preprint arXiv:2404.19756<\/em>.<\/li>\n\n\n\n<li>Lo\u00e8ve, M. (1978). <em>Probability Theory II<\/em> (4th ed.). Springer.<\/li>\n\n\n\n<li>Myers, R. H., Montgomery, D. C., &amp; Anderson-Cook, C. M. (2016). <em>Response Surface Methodology: Process and Product Optimization Using Designed Experiments<\/em> (4th ed.). Wiley.<\/li>\n\n\n\n<li>Oh, S. K., &amp; Pedrycz, W. (2002). Self-organizing polynomial neural networks based on polynomial and fuzzy polynomial neurons: Analysis and design. <em>Fuzzy Sets and Systems<\/em>, 142(2), 163\u2013198.<\/li>\n\n\n\n<li>Oladyshkin, S., &amp; Nowak, W. (2012). Data-driven uncertainty quantification using the arbitrary polynomial chaos expansion. <em>Reliability Engineering &amp; System Safety<\/em>, 106, 179\u2013190.<\/li>\n\n\n\n<li>Raissi, M., Perdikaris, P., &amp; Karniadakis, G. E. (2019). Physics-informed neural networks: A deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations. <em>Journal of Computational Physics<\/em>, 378, 686\u2013707.<\/li>\n\n\n\n<li>Rendle, S. (2010). Factorization machines. <em>IEEE International Conference on Data Mining<\/em>, 995\u20131000.<\/li>\n\n\n\n<li>Sch\u00f6bi, R., Sudret, B., &amp; Wiart, J. (2015). Polynomial-chaos-based Kriging. <em>International Journal for Uncertainty Quantification<\/em>, 5(2), 171\u2013193.<\/li>\n\n\n\n<li>Sobol, I. M. (1993). Sensitivity estimates for nonlinear mathematical models. <em>Mathematical Modelling and Computational Experiments<\/em>, 1(4), 407\u2013414.<\/li>\n\n\n\n<li>Sudret, B. (2008). Global sensitivity analysis using polynomial chaos expansions. <em>Reliability Engineering &amp; System Safety<\/em>, 93(7), 964\u2013979.<\/li>\n\n\n\n<li>Tibshirani, R. (1996). Regression shrinkage and selection via the lasso. <em>Journal of the Royal Statistical Society: Series B<\/em>, 58(1), 267\u2013288.<\/li>\n\n\n\n<li>Xiu, D., &amp; Karniadakis, G. E. (2002). The Wiener-Askey polynomial chaos for stochastic differential equations. <em>SIAM Journal on Scientific Computing<\/em>, 24(2), 619\u2013644.<\/li>\n\n\n\n<li>Zou, H., &amp; Hastie, T. (2005). Regularization and variable selection via the elastic net. <em>Journal of the Royal Statistical Society: Series B<\/em>, 67(2), 301\u2013320.<\/li>\n<\/ul>\n<\/div><\/div>\n<div style='text-align:center' class='yasr-auto-insert-overall'><\/div><div style='text-align:center' class='yasr-auto-insert-visitor'><\/div>","protected":false},"excerpt":{"rendered":"<p>\u2003This report surveys Polynomial Machine Learning (PML) at an introductory level. PML refers to the family of techniques that exploit higher-order and interaction terms of input variables to learn nonlinear relationships. The discussion is organized along three taxonomic axes and arranged into six hierarchical levels. Deep mathematical or theoretical analysis is intentionally avoided; the goal&#8230;<\/p>\n","protected":false},"author":4,"featured_media":6620,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_bbp_topic_count":0,"_bbp_reply_count":0,"_bbp_total_topic_count":0,"_bbp_total_reply_count":0,"_bbp_voice_count":0,"_bbp_anonymous_reply_count":0,"_bbp_topic_count_hidden":0,"_bbp_reply_count_hidden":0,"_bbp_forum_subforum_count":0,"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","yasr_overall_rating":0,"yasr_post_is_review":"","yasr_auto_insert_disabled":"","yasr_review_type":"","fifu_image_url":"","fifu_image_alt":"","iawp_total_views":1,"footnotes":""},"categories":[4,18,56,374],"tags":[],"class_list":["post-6615","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-semiconductor-slug","category-ai-powered-slug","category-data-science-slug","category-label-engineering-slug"],"yasr_visitor_votes":{"stars_attributes":{"read_only":false,"span_bottom":false},"number_of_votes":1,"sum_votes":2},"jetpack_featured_media_url":"https:\/\/ykim.synology.me\/wordpress\/wp-content\/uploads\/2026\/05\/Whataburger-Austin-800x600px.jpg","_links":{"self":[{"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/posts\/6615","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/comments?post=6615"}],"version-history":[{"count":13,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/posts\/6615\/revisions"}],"predecessor-version":[{"id":6636,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/posts\/6615\/revisions\/6636"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/media\/6620"}],"wp:attachment":[{"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/media?parent=6615"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/categories?post=6615"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/ykim.synology.me\/wordpress\/wp-json\/wp\/v2\/tags?post=6615"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}