Eliminate a couple of non-DebugLoc BuildMI variants.
[oota-llvm.git] / lib / Target / PowerPC / PPCPerfectShuffle.h
index e48c3cb17fee1892c555eb6cf8b2c23353e22914..3164e33faae9eb69388e65a237ca8825a82a9718 100644 (file)
@@ -2,8 +2,8 @@
 //
 //                     The LLVM Compiler Infrastructure
 //
-// This file was developed by Chris Lattner and is distributed under
-// the University of Illinois Open Source License. See LICENSE.TXT for details.
+// This file is distributed under the University of Illinois Open Source
+// License. See LICENSE.TXT for details.
 //
 //===----------------------------------------------------------------------===//
 //
 
 // This table is 6561*4 = 26244 bytes in size.
 static const unsigned PerfectShuffleTable[6561+1] = {
-  1275904102U, // <0,0,0,0>: Cost 1 vspltisw0 LHS
-  2214592614U, // <0,0,0,1>: Cost 2 vmrghw <0,0,0,0>, LHS
-  3690989005U, // <0,0,0,2>: Cost 3 vsldoi4 <0,0,0,0>, <2,0,3,0>
-  3708905611U, // <0,0,0,3>: Cost 3 vsldoi4 <3,0,0,0>, <3,0,0,0>
-  2617249078U, // <0,0,0,4>: Cost 2 vsldoi4 <0,0,0,0>, RHS
-  3355443529U, // <0,0,0,5>: Cost 3 vmrglw <0,0,0,0>, <0,4,0,5>
-  3690991957U, // <0,0,0,6>: Cost 3 vsldoi4 <0,0,0,0>, <6,0,7,0>
-  3732796399U, // <0,0,0,7>: Cost 3 vsldoi4 <7,0,0,0>, <7,0,0,0>
-  1275904102U, // <0,0,0,u>: Cost 1 vspltisw0 LHS
-  2215428106U, // <0,0,1,0>: Cost 2 vmrghw LHS, <0,0,1,1>
-  1141686374U, // <0,0,1,1>: Cost 1 vmrghw LHS, LHS
-  2758983782U, // <0,0,1,2>: Cost 2 vsldoi12 <1,2,3,0>, LHS
-  3289612540U, // <0,0,1,3>: Cost 3 vmrghw LHS, <0,3,1,0>
-  2215469394U, // <0,0,1,4>: Cost 2 vmrghw LHS, <0,4,1,5>
-  3289170386U, // <0,0,1,5>: Cost 3 vmrghw LHS, <0,5,6,7>
-  3289170413U, // <0,0,1,6>: Cost 3 vmrghw LHS, <0,6,0,7>
-  3732804592U, // <0,0,1,7>: Cost 3 vsldoi4 <7,0,0,1>, <7,0,0,1>
-  1141686941U, // <0,0,1,u>: Cost 1 vmrghw LHS, LHS
-  3758097869U, // <0,0,2,0>: Cost 3 vsldoi8 <0,0,0,0>, <2,0,3,0>
-  3289751654U, // <0,0,2,1>: Cost 3 vmrghw <0,2,1,2>, LHS
-  3289751725U, // <0,0,2,2>: Cost 3 vmrghw <0,2,1,2>, <0,2,1,2>
-  3772032677U, // <0,0,2,3>: Cost 3 vsldoi8 <2,3,0,0>, <2,3,0,0>
+  202162278U,  // <0,0,0,0>: Cost 1 vspltisw0 LHS
+  1140850790U, // <0,0,0,1>: Cost 2 vmrghw <0,0,0,0>, LHS
+  2617247181U, // <0,0,0,2>: Cost 3 vsldoi4 <0,0,0,0>, <2,0,3,0>
+  2635163787U, // <0,0,0,3>: Cost 3 vsldoi4 <3,0,0,0>, <3,0,0,0>
+  1543507254U, // <0,0,0,4>: Cost 2 vsldoi4 <0,0,0,0>, RHS
+  2281701705U, // <0,0,0,5>: Cost 3 vmrglw <0,0,0,0>, <0,4,0,5>
+  2617250133U, // <0,0,0,6>: Cost 3 vsldoi4 <0,0,0,0>, <6,0,7,0>
+  2659054575U, // <0,0,0,7>: Cost 3 vsldoi4 <7,0,0,0>, <7,0,0,0>
+  202162278U,  // <0,0,0,u>: Cost 1 vspltisw0 LHS
+  1141686282U, // <0,0,1,0>: Cost 2 vmrghw LHS, <0,0,1,1>
+  67944550U,   // <0,0,1,1>: Cost 1 vmrghw LHS, LHS
+  1685241958U, // <0,0,1,2>: Cost 2 vsldoi12 <1,2,3,0>, LHS
+  2215870716U, // <0,0,1,3>: Cost 3 vmrghw LHS, <0,3,1,0>
+  1141727570U, // <0,0,1,4>: Cost 2 vmrghw LHS, <0,4,1,5>
+  2215428562U, // <0,0,1,5>: Cost 3 vmrghw LHS, <0,5,6,7>
+  2215428589U, // <0,0,1,6>: Cost 3 vmrghw LHS, <0,6,0,7>
+  2659062768U, // <0,0,1,7>: Cost 3 vsldoi4 <7,0,0,1>, <7,0,0,1>
+  67945117U,   // <0,0,1,u>: Cost 1 vmrghw LHS, LHS
+  2684356045U, // <0,0,2,0>: Cost 3 vsldoi8 <0,0,0,0>, <2,0,3,0>
+  2216009830U, // <0,0,2,1>: Cost 3 vmrghw <0,2,1,2>, LHS
+  2216009901U, // <0,0,2,2>: Cost 3 vmrghw <0,2,1,2>, <0,2,1,2>
+  2698290853U, // <0,0,2,3>: Cost 3 vsldoi8 <2,3,0,0>, <2,3,0,0>
   3289751890U, // <0,0,2,4>: Cost 4 vmrghw <0,2,1,2>, <0,4,1,5>
   3758098275U, // <0,0,2,5>: Cost 4 vsldoi8 <0,0,0,0>, <2,5,3,1>
-  3758098362U, // <0,0,2,6>: Cost 3 vsldoi8 <0,0,0,0>, <2,6,3,7>
+  2684356538U, // <0,0,2,6>: Cost 3 vsldoi8 <0,0,0,0>, <2,6,3,7>
   3758098410U, // <0,0,2,7>: Cost 4 vsldoi8 <0,0,0,0>, <2,7,0,1>
-  3289752221U, // <0,0,2,u>: Cost 3 vmrghw <0,2,1,2>, LHS
-  3776014475U, // <0,0,3,0>: Cost 3 vsldoi8 <3,0,0,0>, <3,0,0,0>
-  3290398822U, // <0,0,3,1>: Cost 3 vmrghw <0,3,1,0>, LHS
+  2216010397U, // <0,0,2,u>: Cost 3 vmrghw <0,2,1,2>, LHS
+  2702272651U, // <0,0,3,0>: Cost 3 vsldoi8 <3,0,0,0>, <3,0,0,0>
+  2216656998U, // <0,0,3,1>: Cost 3 vmrghw <0,3,1,0>, LHS
   3844669704U, // <0,0,3,2>: Cost 4 vsldoi12 <3,2,3,0>, <0,3,2,3>
-  3290398972U, // <0,0,3,3>: Cost 3 vmrghw <0,3,1,0>, <0,3,1,0>
-  3758098946U, // <0,0,3,4>: Cost 3 vsldoi8 <0,0,0,0>, <3,4,5,6>
+  2216657148U, // <0,0,3,3>: Cost 3 vmrghw <0,3,1,0>, <0,3,1,0>
+  2684357122U, // <0,0,3,4>: Cost 3 vsldoi8 <0,0,0,0>, <3,4,5,6>
   3732820066U, // <0,0,3,5>: Cost 4 vsldoi4 <7,0,0,3>, <5,6,7,0>
   3778005624U, // <0,0,3,6>: Cost 4 vsldoi8 <3,3,0,0>, <3,6,0,7>
   3374713464U, // <0,0,3,7>: Cost 4 vmrglw <3,2,0,3>, <3,6,0,7>
-  3290399389U, // <0,0,3,u>: Cost 3 vmrghw <0,3,1,0>, LHS
-  3291103232U, // <0,0,4,0>: Cost 3 vmrghw <0,4,1,5>, <0,0,0,0>
-  2217361510U, // <0,0,4,1>: Cost 2 vmrghw <0,4,1,5>, LHS
+  2216657565U, // <0,0,3,u>: Cost 3 vmrghw <0,3,1,0>, LHS
+  2217361408U, // <0,0,4,0>: Cost 3 vmrghw <0,4,1,5>, <0,0,0,0>
+  1143619686U, // <0,0,4,1>: Cost 2 vmrghw <0,4,1,5>, LHS
   3291103405U, // <0,0,4,2>: Cost 4 vmrghw <0,4,1,5>, <0,2,1,2>
   3827269988U, // <0,0,4,3>: Cost 4 vsldoi12 <0,3,1,0>, <0,4,3,5>
-  2217361746U, // <0,0,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
-  2684357942U, // <0,0,4,5>: Cost 2 vsldoi8 <0,0,0,0>, RHS
+  1143619922U, // <0,0,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
+  1610616118U, // <0,0,4,5>: Cost 2 vsldoi8 <0,0,0,0>, RHS
   3758099833U, // <0,0,4,6>: Cost 4 vsldoi8 <0,0,0,0>, <4,6,5,2>
   3854107016U, // <0,0,4,7>: Cost 4 vsldoi12 <4,7,5,0>, <0,4,7,5>
-  2217362077U, // <0,0,4,u>: Cost 2 vmrghw <0,4,1,5>, LHS
-  3358138368U, // <0,0,5,0>: Cost 3 vmrglw <0,4,0,5>, <0,0,0,0>
-  3291766886U, // <0,0,5,1>: Cost 3 vmrghw <0,5,1,5>, LHS
+  1143620253U, // <0,0,4,u>: Cost 2 vmrghw <0,4,1,5>, LHS
+  2284396544U, // <0,0,5,0>: Cost 3 vmrglw <0,4,0,5>, <0,0,0,0>
+  2218025062U, // <0,0,5,1>: Cost 3 vmrghw <0,5,1,5>, LHS
   3758100203U, // <0,0,5,2>: Cost 4 vsldoi8 <0,0,0,0>, <5,2,1,3>
   3395966100U, // <0,0,5,3>: Cost 4 vmrglw <6,7,0,5>, <7,2,0,3>
   3804549052U, // <0,0,5,4>: Cost 4 vsldoi8 <7,7,0,0>, <5,4,6,5>
-  3376056788U, // <0,0,5,5>: Cost 3 vmrglw <3,4,0,5>, <3,4,0,5>
-  3859562962U, // <0,0,5,6>: Cost 3 vsldoi12 <5,6,7,0>, <0,5,6,7>
+  2302314964U, // <0,0,5,5>: Cost 3 vmrglw <3,4,0,5>, <3,4,0,5>
+  2785821138U, // <0,0,5,6>: Cost 3 vsldoi12 <5,6,7,0>, <0,5,6,7>
   3395966428U, // <0,0,5,7>: Cost 4 vmrglw <6,7,0,5>, <7,6,0,7>
-  3860890084U, // <0,0,5,u>: Cost 3 vsldoi12 <5,u,7,0>, <0,5,u,7>
-  3758100821U, // <0,0,6,0>: Cost 3 vsldoi8 <0,0,0,0>, <6,0,7,0>
-  3292373094U, // <0,0,6,1>: Cost 3 vmrghw <0,6,0,7>, LHS
-  3758100986U, // <0,0,6,2>: Cost 3 vsldoi8 <0,0,0,0>, <6,2,7,3>
+  2787148260U, // <0,0,5,u>: Cost 3 vsldoi12 <5,u,7,0>, <0,5,u,7>
+  2684358997U, // <0,0,6,0>: Cost 3 vsldoi8 <0,0,0,0>, <6,0,7,0>
+  2218631270U, // <0,0,6,1>: Cost 3 vmrghw <0,6,0,7>, LHS
+  2684359162U, // <0,0,6,2>: Cost 3 vsldoi8 <0,0,0,0>, <6,2,7,3>
   3758101042U, // <0,0,6,3>: Cost 4 vsldoi8 <0,0,0,0>, <6,3,4,5>
   3732843830U, // <0,0,6,4>: Cost 4 vsldoi4 <7,0,0,6>, RHS
   3758101227U, // <0,0,6,5>: Cost 4 vsldoi8 <0,0,0,0>, <6,5,7,1>
-  3758101304U, // <0,0,6,6>: Cost 3 vsldoi8 <0,0,0,0>, <6,6,6,6>
-  3798577997U, // <0,0,6,7>: Cost 3 vsldoi8 <6,7,0,0>, <6,7,0,0>
-  3799241630U, // <0,0,6,u>: Cost 3 vsldoi8 <6,u,0,0>, <6,u,0,0>
-  3799905263U, // <0,0,7,0>: Cost 3 vsldoi8 <7,0,0,0>, <7,0,0,0>
-  3293053030U, // <0,0,7,1>: Cost 3 vmrghw <0,7,1,0>, LHS
+  2684359480U, // <0,0,6,6>: Cost 3 vsldoi8 <0,0,0,0>, <6,6,6,6>
+  2724836173U, // <0,0,6,7>: Cost 3 vsldoi8 <6,7,0,0>, <6,7,0,0>
+  2725499806U, // <0,0,6,u>: Cost 3 vsldoi8 <6,u,0,0>, <6,u,0,0>
+  2726163439U, // <0,0,7,0>: Cost 3 vsldoi8 <7,0,0,0>, <7,0,0,0>
+  2219311206U, // <0,0,7,1>: Cost 3 vmrghw <0,7,1,0>, LHS
   3868557900U, // <0,0,7,2>: Cost 4 vsldoi12 <7,2,3,0>, <0,7,2,3>
   3377400112U, // <0,0,7,3>: Cost 4 vmrglw <3,6,0,7>, <3,2,0,3>
-  3758101862U, // <0,0,7,4>: Cost 3 vsldoi8 <0,0,0,0>, <7,4,5,6>
+  2684360038U, // <0,0,7,4>: Cost 3 vsldoi8 <0,0,0,0>, <7,4,5,6>
   3732852834U, // <0,0,7,5>: Cost 4 vsldoi4 <7,0,0,7>, <5,6,7,0>
   3871507060U, // <0,0,7,6>: Cost 4 vsldoi12 <7,6,7,0>, <0,7,6,7>
-  3377400440U, // <0,0,7,7>: Cost 3 vmrglw <3,6,0,7>, <3,6,0,7>
-  3799905263U, // <0,0,7,u>: Cost 3 vsldoi8 <7,0,0,0>, <7,0,0,0>
-  1275904102U, // <0,0,u,0>: Cost 1 vspltisw0 LHS
-  1146331238U, // <0,0,u,1>: Cost 1 vmrghw LHS, LHS
-  2758984349U, // <0,0,u,2>: Cost 2 vsldoi12 <1,2,3,0>, LHS
-  3293815036U, // <0,0,u,3>: Cost 3 vmrghw LHS, <0,3,1,0>
-  2220073298U, // <0,0,u,4>: Cost 2 vmrghw LHS, <0,4,1,5>
-  2684360858U, // <0,0,u,5>: Cost 2 vsldoi8 <0,0,0,0>, RHS
-  3859562962U, // <0,0,u,6>: Cost 3 vsldoi12 <5,6,7,0>, <0,5,6,7>
-  3732861943U, // <0,0,u,7>: Cost 3 vsldoi4 <7,0,0,u>, <7,0,0,u>
-  1146331805U, // <0,0,u,u>: Cost 1 vmrghw LHS, LHS
-  3772039168U, // <0,1,0,0>: Cost 3 vsldoi8 <2,3,0,1>, <0,0,0,0>
-  2698297446U, // <0,1,0,1>: Cost 2 vsldoi8 <2,3,0,1>, LHS
-  3832726252U, // <0,1,0,2>: Cost 3 vsldoi12 <1,2,3,0>, <1,0,2,1>
-  3708979348U, // <0,1,0,3>: Cost 3 vsldoi4 <3,0,1,0>, <3,0,1,0>
-  3767394642U, // <0,1,0,4>: Cost 3 vsldoi8 <1,5,0,1>, <0,4,1,5>
-  3355443538U, // <0,1,0,5>: Cost 3 vmrglw <0,0,0,0>, <0,4,1,5>
-  3772039670U, // <0,1,0,6>: Cost 3 vsldoi8 <2,3,0,1>, <0,6,1,7>
-  3732870136U, // <0,1,0,7>: Cost 3 vsldoi4 <7,0,1,0>, <7,0,1,0>
-  2698298013U, // <0,1,0,u>: Cost 2 vsldoi8 <2,3,0,1>, LHS
-  2617327626U, // <0,1,1,0>: Cost 2 vsldoi4 <0,0,1,1>, <0,0,1,1>
-  2215469876U, // <0,1,1,1>: Cost 2 vmrghw LHS, <1,1,1,1>
-  2215469974U, // <0,1,1,2>: Cost 2 vmrghw LHS, <1,2,3,0>
-  3369386158U, // <0,1,1,3>: Cost 3 vmrglw <2,3,0,1>, <0,2,1,3>
-  2617330998U, // <0,1,1,4>: Cost 2 vsldoi4 <0,0,1,1>, RHS
-  3364741458U, // <0,1,1,5>: Cost 3 vmrglw <1,5,0,1>, <0,4,1,5>
-  3691073959U, // <0,1,1,6>: Cost 3 vsldoi4 <0,0,1,1>, <6,1,7,1>
-  3691074544U, // <0,1,1,7>: Cost 3 vsldoi4 <0,0,1,1>, <7,0,0,1>
-  2215912828U, // <0,1,1,u>: Cost 2 vmrghw LHS, <1,u,3,0>
-  2635251814U, // <0,1,2,0>: Cost 2 vsldoi4 <3,0,1,2>, LHS
-  3697050340U, // <0,1,2,1>: Cost 3 vsldoi4 <1,0,1,2>, <1,0,1,2>
-  3772040808U, // <0,1,2,2>: Cost 3 vsldoi8 <2,3,0,1>, <2,2,2,2>
+  2303658616U, // <0,0,7,7>: Cost 3 vmrglw <3,6,0,7>, <3,6,0,7>
+  2726163439U, // <0,0,7,u>: Cost 3 vsldoi8 <7,0,0,0>, <7,0,0,0>
+  202162278U,  // <0,0,u,0>: Cost 1 vspltisw0 LHS
+  72589414U,   // <0,0,u,1>: Cost 1 vmrghw LHS, LHS
+  1685242525U, // <0,0,u,2>: Cost 2 vsldoi12 <1,2,3,0>, LHS
+  2220073212U, // <0,0,u,3>: Cost 3 vmrghw LHS, <0,3,1,0>
+  1146331474U, // <0,0,u,4>: Cost 2 vmrghw LHS, <0,4,1,5>
+  1610619034U, // <0,0,u,5>: Cost 2 vsldoi8 <0,0,0,0>, RHS
+  2785821138U, // <0,0,u,6>: Cost 3 vsldoi12 <5,6,7,0>, <0,5,6,7>
+  2659120119U, // <0,0,u,7>: Cost 3 vsldoi4 <7,0,0,u>, <7,0,0,u>
+  72589981U,   // <0,0,u,u>: Cost 1 vmrghw LHS, LHS
+  2698297344U, // <0,1,0,0>: Cost 3 vsldoi8 <2,3,0,1>, <0,0,0,0>
+  1624555622U, // <0,1,0,1>: Cost 2 vsldoi8 <2,3,0,1>, LHS
+  2758984428U, // <0,1,0,2>: Cost 3 vsldoi12 <1,2,3,0>, <1,0,2,1>
+  2635237524U, // <0,1,0,3>: Cost 3 vsldoi4 <3,0,1,0>, <3,0,1,0>
+  2693652818U, // <0,1,0,4>: Cost 3 vsldoi8 <1,5,0,1>, <0,4,1,5>
+  2281701714U, // <0,1,0,5>: Cost 3 vmrglw <0,0,0,0>, <0,4,1,5>
+  2698297846U, // <0,1,0,6>: Cost 3 vsldoi8 <2,3,0,1>, <0,6,1,7>
+  2659128312U, // <0,1,0,7>: Cost 3 vsldoi4 <7,0,1,0>, <7,0,1,0>
+  1624556189U, // <0,1,0,u>: Cost 2 vsldoi8 <2,3,0,1>, LHS
+  1543585802U, // <0,1,1,0>: Cost 2 vsldoi4 <0,0,1,1>, <0,0,1,1>
+  1141728052U, // <0,1,1,1>: Cost 2 vmrghw LHS, <1,1,1,1>
+  1141728150U, // <0,1,1,2>: Cost 2 vmrghw LHS, <1,2,3,0>
+  2295644334U, // <0,1,1,3>: Cost 3 vmrglw <2,3,0,1>, <0,2,1,3>
+  1543589174U, // <0,1,1,4>: Cost 2 vsldoi4 <0,0,1,1>, RHS
+  2290999634U, // <0,1,1,5>: Cost 3 vmrglw <1,5,0,1>, <0,4,1,5>
+  2617332135U, // <0,1,1,6>: Cost 3 vsldoi4 <0,0,1,1>, <6,1,7,1>
+  2617332720U, // <0,1,1,7>: Cost 3 vsldoi4 <0,0,1,1>, <7,0,0,1>
+  1142171004U, // <0,1,1,u>: Cost 2 vmrghw LHS, <1,u,3,0>
+  1561509990U, // <0,1,2,0>: Cost 2 vsldoi4 <3,0,1,2>, LHS
+  2623308516U, // <0,1,2,1>: Cost 3 vsldoi4 <1,0,1,2>, <1,0,1,2>
+  2698298984U, // <0,1,2,2>: Cost 3 vsldoi8 <2,3,0,1>, <2,2,2,2>
   835584U,     // <0,1,2,3>: Cost 0 copy LHS
-  2635255094U, // <0,1,2,4>: Cost 2 vsldoi4 <3,0,1,2>, RHS
-  3720941128U, // <0,1,2,5>: Cost 3 vsldoi4 <5,0,1,2>, <5,0,1,2>
-  3772041146U, // <0,1,2,6>: Cost 3 vsldoi8 <2,3,0,1>, <2,6,3,7>
-  2659144698U, // <0,1,2,7>: Cost 2 vsldoi4 <7,0,1,2>, <7,0,1,2>
+  1561513270U, // <0,1,2,4>: Cost 2 vsldoi4 <3,0,1,2>, RHS
+  2647199304U, // <0,1,2,5>: Cost 3 vsldoi4 <5,0,1,2>, <5,0,1,2>
+  2698299322U, // <0,1,2,6>: Cost 3 vsldoi8 <2,3,0,1>, <2,6,3,7>
+  1585402874U, // <0,1,2,7>: Cost 2 vsldoi4 <7,0,1,2>, <7,0,1,2>
   835584U,     // <0,1,2,u>: Cost 0 copy LHS
-  3772041364U, // <0,1,3,0>: Cost 3 vsldoi8 <2,3,0,1>, <3,0,1,0>
+  2698299540U, // <0,1,3,0>: Cost 3 vsldoi8 <2,3,0,1>, <3,0,1,0>
   3290399540U, // <0,1,3,1>: Cost 4 vmrghw <0,3,1,0>, <1,1,1,1>
-  3772041544U, // <0,1,3,2>: Cost 3 vsldoi8 <2,3,0,1>, <3,2,3,0>
-  3772041628U, // <0,1,3,3>: Cost 3 vsldoi8 <2,3,0,1>, <3,3,3,3>
-  3772041730U, // <0,1,3,4>: Cost 3 vsldoi8 <2,3,0,1>, <3,4,5,6>
+  2698299720U, // <0,1,3,2>: Cost 3 vsldoi8 <2,3,0,1>, <3,2,3,0>
+  2698299804U, // <0,1,3,3>: Cost 3 vsldoi8 <2,3,0,1>, <3,3,3,3>
+  2698299906U, // <0,1,3,4>: Cost 3 vsldoi8 <2,3,0,1>, <3,4,5,6>
   3832726521U, // <0,1,3,5>: Cost 4 vsldoi12 <1,2,3,0>, <1,3,5,0>
-  3798583984U, // <0,1,3,6>: Cost 3 vsldoi8 <6,7,0,1>, <3,6,7,0>
-  3780668099U, // <0,1,3,7>: Cost 3 vsldoi8 <3,7,0,1>, <3,7,0,1>
-  3772042014U, // <0,1,3,u>: Cost 3 vsldoi8 <2,3,0,1>, <3,u,1,2>
-  3709010022U, // <0,1,4,0>: Cost 3 vsldoi4 <3,0,1,4>, LHS
-  3291104052U, // <0,1,4,1>: Cost 3 vmrghw <0,4,1,5>, <1,1,1,1>
-  3291104150U, // <0,1,4,2>: Cost 3 vmrghw <0,4,1,5>, <1,2,3,0>
-  3709012120U, // <0,1,4,3>: Cost 3 vsldoi4 <3,0,1,4>, <3,0,1,4>
-  3709013302U, // <0,1,4,4>: Cost 3 vsldoi4 <3,0,1,4>, RHS
-  2698300726U, // <0,1,4,5>: Cost 2 vsldoi8 <2,3,0,1>, RHS
-  3732902734U, // <0,1,4,6>: Cost 3 vsldoi4 <7,0,1,4>, <6,7,0,1>
-  3732902908U, // <0,1,4,7>: Cost 3 vsldoi4 <7,0,1,4>, <7,0,1,4>
-  2698300969U, // <0,1,4,u>: Cost 2 vsldoi8 <2,3,0,1>, RHS
+  2724842160U, // <0,1,3,6>: Cost 3 vsldoi8 <6,7,0,1>, <3,6,7,0>
+  2706926275U, // <0,1,3,7>: Cost 3 vsldoi8 <3,7,0,1>, <3,7,0,1>
+  2698300190U, // <0,1,3,u>: Cost 3 vsldoi8 <2,3,0,1>, <3,u,1,2>
+  2635268198U, // <0,1,4,0>: Cost 3 vsldoi4 <3,0,1,4>, LHS
+  2217362228U, // <0,1,4,1>: Cost 3 vmrghw <0,4,1,5>, <1,1,1,1>
+  2217362326U, // <0,1,4,2>: Cost 3 vmrghw <0,4,1,5>, <1,2,3,0>
+  2635270296U, // <0,1,4,3>: Cost 3 vsldoi4 <3,0,1,4>, <3,0,1,4>
+  2635271478U, // <0,1,4,4>: Cost 3 vsldoi4 <3,0,1,4>, RHS
+  1624558902U, // <0,1,4,5>: Cost 2 vsldoi8 <2,3,0,1>, RHS
+  2659160910U, // <0,1,4,6>: Cost 3 vsldoi4 <7,0,1,4>, <6,7,0,1>
+  2659161084U, // <0,1,4,7>: Cost 3 vsldoi4 <7,0,1,4>, <7,0,1,4>
+  1624559145U, // <0,1,4,u>: Cost 2 vsldoi8 <2,3,0,1>, RHS
   3832726639U, // <0,1,5,0>: Cost 4 vsldoi12 <1,2,3,0>, <1,5,0,1>
-  3788631695U, // <0,1,5,1>: Cost 3 vsldoi8 <5,1,0,1>, <5,1,0,1>
-  3376056470U, // <0,1,5,2>: Cost 3 vmrglw <3,4,0,5>, <3,0,1,2>
+  2714889871U, // <0,1,5,1>: Cost 3 vsldoi8 <5,1,0,1>, <5,1,0,1>
+  2302314646U, // <0,1,5,2>: Cost 3 vmrglw <3,4,0,5>, <3,0,1,2>
   3834717321U, // <0,1,5,3>: Cost 4 vsldoi12 <1,5,3,0>, <1,5,3,0>
   3832726679U, // <0,1,5,4>: Cost 4 vsldoi12 <1,2,3,0>, <1,5,4,5>
-  3791286227U, // <0,1,5,5>: Cost 3 vsldoi8 <5,5,0,1>, <5,5,0,1>
-  3791949860U, // <0,1,5,6>: Cost 3 vsldoi8 <5,6,0,1>, <5,6,0,1>
+  2717544403U, // <0,1,5,5>: Cost 3 vsldoi8 <5,5,0,1>, <5,5,0,1>
+  2718208036U, // <0,1,5,6>: Cost 3 vsldoi8 <5,6,0,1>, <5,6,0,1>
   3792613493U, // <0,1,5,7>: Cost 4 vsldoi8 <5,7,0,1>, <5,7,0,1>
-  3793277126U, // <0,1,5,u>: Cost 3 vsldoi8 <5,u,0,1>, <5,u,0,1>
-  3732914278U, // <0,1,6,0>: Cost 3 vsldoi4 <7,0,1,6>, LHS
+  2719535302U, // <0,1,5,u>: Cost 3 vsldoi8 <5,u,0,1>, <5,u,0,1>
+  2659172454U, // <0,1,6,0>: Cost 3 vsldoi4 <7,0,1,6>, LHS
   3832726735U, // <0,1,6,1>: Cost 4 vsldoi12 <1,2,3,0>, <1,6,1,7>
-  3798585850U, // <0,1,6,2>: Cost 3 vsldoi8 <6,7,0,1>, <6,2,7,3>
+  2724844026U, // <0,1,6,2>: Cost 3 vsldoi8 <6,7,0,1>, <6,2,7,3>
   3775361608U, // <0,1,6,3>: Cost 4 vsldoi8 <2,u,0,1>, <6,3,7,0>
-  3732917558U, // <0,1,6,4>: Cost 3 vsldoi4 <7,0,1,6>, RHS
+  2659175734U, // <0,1,6,4>: Cost 3 vsldoi4 <7,0,1,6>, RHS
   3832726771U, // <0,1,6,5>: Cost 4 vsldoi12 <1,2,3,0>, <1,6,5,7>
-  3798586168U, // <0,1,6,6>: Cost 3 vsldoi8 <6,7,0,1>, <6,6,6,6>
-  2724844366U, // <0,1,6,7>: Cost 2 vsldoi8 <6,7,0,1>, <6,7,0,1>
-  2725507999U, // <0,1,6,u>: Cost 2 vsldoi8 <6,u,0,1>, <6,u,0,1>
-  3798586360U, // <0,1,7,0>: Cost 3 vsldoi8 <6,7,0,1>, <7,0,1,0>
+  2724844344U, // <0,1,6,6>: Cost 3 vsldoi8 <6,7,0,1>, <6,6,6,6>
+  1651102542U, // <0,1,6,7>: Cost 2 vsldoi8 <6,7,0,1>, <6,7,0,1>
+  1651766175U, // <0,1,6,u>: Cost 2 vsldoi8 <6,u,0,1>, <6,u,0,1>
+  2724844536U, // <0,1,7,0>: Cost 3 vsldoi8 <6,7,0,1>, <7,0,1,0>
   3377397770U, // <0,1,7,1>: Cost 4 vmrglw <3,6,0,7>, <0,0,1,1>
-  3772044460U, // <0,1,7,2>: Cost 3 vsldoi8 <2,3,0,1>, <7,2,3,0>
-  3801904355U, // <0,1,7,3>: Cost 3 vsldoi8 <7,3,0,1>, <7,3,0,1>
-  3798586726U, // <0,1,7,4>: Cost 3 vsldoi8 <6,7,0,1>, <7,4,5,6>
+  2698302636U, // <0,1,7,2>: Cost 3 vsldoi8 <2,3,0,1>, <7,2,3,0>
+  2728162531U, // <0,1,7,3>: Cost 3 vsldoi8 <7,3,0,1>, <7,3,0,1>
+  2724844902U, // <0,1,7,4>: Cost 3 vsldoi8 <6,7,0,1>, <7,4,5,6>
   3377398098U, // <0,1,7,5>: Cost 4 vmrglw <3,6,0,7>, <0,4,1,5>
-  3798586900U, // <0,1,7,6>: Cost 3 vsldoi8 <6,7,0,1>, <7,6,7,0>
-  3798586988U, // <0,1,7,7>: Cost 3 vsldoi8 <6,7,0,1>, <7,7,7,7>
-  3798587010U, // <0,1,7,u>: Cost 3 vsldoi8 <6,7,0,1>, <7,u,1,2>
-  2635300966U, // <0,1,u,0>: Cost 2 vsldoi4 <3,0,1,u>, LHS
-  2220073780U, // <0,1,u,1>: Cost 2 vmrghw LHS, <1,1,1,1>
-  2220073878U, // <0,1,u,2>: Cost 2 vmrghw LHS, <1,2,3,0>
+  2724845076U, // <0,1,7,6>: Cost 3 vsldoi8 <6,7,0,1>, <7,6,7,0>
+  2724845164U, // <0,1,7,7>: Cost 3 vsldoi8 <6,7,0,1>, <7,7,7,7>
+  2724845186U, // <0,1,7,u>: Cost 3 vsldoi8 <6,7,0,1>, <7,u,1,2>
+  1561559142U, // <0,1,u,0>: Cost 2 vsldoi4 <3,0,1,u>, LHS
+  1146331956U, // <0,1,u,1>: Cost 2 vmrghw LHS, <1,1,1,1>
+  1146332054U, // <0,1,u,2>: Cost 2 vmrghw LHS, <1,2,3,0>
   835584U,     // <0,1,u,3>: Cost 0 copy LHS
-  2635304246U, // <0,1,u,4>: Cost 2 vsldoi4 <3,0,1,u>, RHS
-  2698303642U, // <0,1,u,5>: Cost 2 vsldoi8 <2,3,0,1>, RHS
-  3293816015U, // <0,1,u,6>: Cost 3 vmrghw LHS, <1,6,1,7>
-  2659193856U, // <0,1,u,7>: Cost 2 vsldoi4 <7,0,1,u>, <7,0,1,u>
+  1561562422U, // <0,1,u,4>: Cost 2 vsldoi4 <3,0,1,u>, RHS
+  1624561818U, // <0,1,u,5>: Cost 2 vsldoi8 <2,3,0,1>, RHS
+  2220074191U, // <0,1,u,6>: Cost 3 vmrghw LHS, <1,6,1,7>
+  1585452032U, // <0,1,u,7>: Cost 2 vsldoi4 <7,0,1,u>, <7,0,1,u>
   835584U,     // <0,1,u,u>: Cost 0 copy LHS
-  3288335821U, // <0,2,0,0>: Cost 3 vmrghw <0,0,0,0>, <2,0,3,0>
-  3288417823U, // <0,2,0,1>: Cost 3 vmrghw <0,0,1,1>, <2,1,3,1>
-  3288335976U, // <0,2,0,2>: Cost 3 vmrghw <0,0,0,0>, <2,2,2,2>
-  2281701478U, // <0,2,0,3>: Cost 2 vmrglw <0,0,0,0>, LHS
+  2214593997U, // <0,2,0,0>: Cost 3 vmrghw <0,0,0,0>, <2,0,3,0>
+  2214675999U, // <0,2,0,1>: Cost 3 vmrghw <0,0,1,1>, <2,1,3,1>
+  2214594152U, // <0,2,0,2>: Cost 3 vmrghw <0,0,0,0>, <2,2,2,2>
+  1207959654U, // <0,2,0,3>: Cost 2 vmrglw <0,0,0,0>, LHS
   3709054262U, // <0,2,0,4>: Cost 4 vsldoi4 <3,0,2,0>, RHS
   3375350836U, // <0,2,0,5>: Cost 4 vmrglw <3,3,0,0>, <1,4,2,5>
-  3288336314U, // <0,2,0,6>: Cost 3 vmrghw <0,0,0,0>, <2,6,3,7>
+  2214594490U, // <0,2,0,6>: Cost 3 vmrghw <0,0,0,0>, <2,6,3,7>
   3288336362U, // <0,2,0,7>: Cost 4 vmrghw <0,0,0,0>, <2,7,0,1>
-  2281701483U, // <0,2,0,u>: Cost 2 vmrglw <0,0,0,0>, LHS
-  3289613818U, // <0,2,1,0>: Cost 3 vmrghw LHS, <2,0,u,0>
-  3289212447U, // <0,2,1,1>: Cost 3 vmrghw LHS, <2,1,3,1>
-  2215470696U, // <0,2,1,2>: Cost 2 vmrghw LHS, <2,2,2,2>
-  2215470758U, // <0,2,1,3>: Cost 2 vmrghw LHS, <2,3,0,1>
-  3289614147U, // <0,2,1,4>: Cost 3 vmrghw LHS, <2,4,u,5>
-  3289614229U, // <0,2,1,5>: Cost 3 vmrghw LHS, <2,5,u,6>
-  2215471034U, // <0,2,1,6>: Cost 2 vmrghw LHS, <2,6,3,7>
-  3289171946U, // <0,2,1,7>: Cost 3 vmrghw LHS, <2,7,0,1>
-  2215471192U, // <0,2,1,u>: Cost 2 vmrghw LHS, <2,u,3,3>
+  1207959659U, // <0,2,0,u>: Cost 2 vmrglw <0,0,0,0>, LHS
+  2215871994U, // <0,2,1,0>: Cost 3 vmrghw LHS, <2,0,u,0>
+  2215470623U, // <0,2,1,1>: Cost 3 vmrghw LHS, <2,1,3,1>
+  1141728872U, // <0,2,1,2>: Cost 2 vmrghw LHS, <2,2,2,2>
+  1141728934U, // <0,2,1,3>: Cost 2 vmrghw LHS, <2,3,0,1>
+  2215872323U, // <0,2,1,4>: Cost 3 vmrghw LHS, <2,4,u,5>
+  2215872405U, // <0,2,1,5>: Cost 3 vmrghw LHS, <2,5,u,6>
+  1141729210U, // <0,2,1,6>: Cost 2 vmrghw LHS, <2,6,3,7>
+  2215430122U, // <0,2,1,7>: Cost 3 vmrghw LHS, <2,7,0,1>
+  1141729368U, // <0,2,1,u>: Cost 2 vmrghw LHS, <2,u,3,3>
   3289736698U, // <0,2,2,0>: Cost 4 vmrghw <0,2,1,0>, <2,0,u,0>
   3289744927U, // <0,2,2,1>: Cost 4 vmrghw <0,2,1,1>, <2,1,3,1>
-  3289753192U, // <0,2,2,2>: Cost 3 vmrghw <0,2,1,2>, <2,2,2,2>
-  3289761446U, // <0,2,2,3>: Cost 3 vmrghw <0,2,1,3>, <2,3,0,1>
+  2216011368U, // <0,2,2,2>: Cost 3 vmrghw <0,2,1,2>, <2,2,2,2>
+  2216019622U, // <0,2,2,3>: Cost 3 vmrghw <0,2,1,3>, <2,3,0,1>
   3289769795U, // <0,2,2,4>: Cost 4 vmrghw <0,2,1,4>, <2,4,u,5>
   3289778069U, // <0,2,2,5>: Cost 4 vmrghw <0,2,1,5>, <2,5,u,6>
-  3289786298U, // <0,2,2,6>: Cost 3 vmrghw <0,2,1,6>, <2,6,3,7>
+  2216044474U, // <0,2,2,6>: Cost 3 vmrghw <0,2,1,6>, <2,6,3,7>
   3732960259U, // <0,2,2,7>: Cost 4 vsldoi4 <7,0,2,2>, <7,0,2,2>
-  3289802840U, // <0,2,2,u>: Cost 3 vmrghw <0,2,1,u>, <2,u,3,3>
-  3832727206U, // <0,2,3,0>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,0,1>
-  3832727216U, // <0,2,3,1>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,1,2>
+  2216061016U, // <0,2,2,u>: Cost 3 vmrghw <0,2,1,u>, <2,u,3,3>
+  2758985382U, // <0,2,3,0>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,0,1>
+  2758985392U, // <0,2,3,1>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,1,2>
   3290400360U, // <0,2,3,2>: Cost 4 vmrghw <0,3,1,0>, <2,2,2,2>
-  3832727232U, // <0,2,3,3>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,3,0>
-  3832727246U, // <0,2,3,4>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,4,5>
-  3859564248U, // <0,2,3,5>: Cost 3 vsldoi12 <5,6,7,0>, <2,3,5,6>
+  2758985408U, // <0,2,3,3>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,3,0>
+  2758985422U, // <0,2,3,4>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,4,5>
+  2785822424U, // <0,2,3,5>: Cost 3 vsldoi12 <5,6,7,0>, <2,3,5,6>
   3290400698U, // <0,2,3,6>: Cost 4 vmrghw <0,3,1,0>, <2,6,3,7>
-  3839657700U, // <0,2,3,7>: Cost 3 vsldoi12 <2,3,7,0>, <2,3,7,0>
-  3832727277U, // <0,2,3,u>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,u,0>
+  2765915876U, // <0,2,3,7>: Cost 3 vsldoi12 <2,3,7,0>, <2,3,7,0>
+  2758985453U, // <0,2,3,u>: Cost 3 vsldoi12 <1,2,3,0>, <2,3,u,0>
   3291104762U, // <0,2,4,0>: Cost 4 vmrghw <0,4,1,5>, <2,0,u,0>
-  3291104803U, // <0,2,4,1>: Cost 3 vmrghw <0,4,1,5>, <2,1,3,5>
-  3291104872U, // <0,2,4,2>: Cost 3 vmrghw <0,4,1,5>, <2,2,2,2>
-  3291104934U, // <0,2,4,3>: Cost 3 vmrghw <0,4,1,5>, <2,3,0,1>
+  2217362979U, // <0,2,4,1>: Cost 3 vmrghw <0,4,1,5>, <2,1,3,5>
+  2217363048U, // <0,2,4,2>: Cost 3 vmrghw <0,4,1,5>, <2,2,2,2>
+  2217363110U, // <0,2,4,3>: Cost 3 vmrghw <0,4,1,5>, <2,3,0,1>
   3291105087U, // <0,2,4,4>: Cost 4 vmrghw <0,4,1,5>, <2,4,u,1>
   3291105173U, // <0,2,4,5>: Cost 4 vmrghw <0,4,1,5>, <2,5,u,6>
-  3291105210U, // <0,2,4,6>: Cost 3 vmrghw <0,4,1,5>, <2,6,3,7>
+  2217363386U, // <0,2,4,6>: Cost 3 vmrghw <0,4,1,5>, <2,6,3,7>
   3788639688U, // <0,2,4,7>: Cost 4 vsldoi8 <5,1,0,2>, <4,7,5,0>
-  3291105339U, // <0,2,4,u>: Cost 3 vmrghw <0,4,1,5>, <2,u,0,1>
+  2217363515U, // <0,2,4,u>: Cost 3 vmrghw <0,4,1,5>, <2,u,0,1>
   3376054371U, // <0,2,5,0>: Cost 4 vmrglw <3,4,0,5>, <0,1,2,0>
   3788639888U, // <0,2,5,1>: Cost 4 vsldoi8 <5,1,0,2>, <5,1,0,2>
   3376055912U, // <0,2,5,2>: Cost 4 vmrglw <3,4,0,5>, <2,2,2,2>
-  3376054374U, // <0,2,5,3>: Cost 3 vmrglw <3,4,0,5>, LHS
+  2302312550U, // <0,2,5,3>: Cost 3 vmrglw <3,4,0,5>, LHS
   3376054375U, // <0,2,5,4>: Cost 4 vmrglw <3,4,0,5>, <0,1,2,4>
   3374728244U, // <0,2,5,5>: Cost 4 vmrglw <3,2,0,5>, <1,4,2,5>
   3805229154U, // <0,2,5,6>: Cost 4 vsldoi8 <7,u,0,2>, <5,6,7,0>
   3376055512U, // <0,2,5,7>: Cost 4 vmrglw <3,4,0,5>, <1,6,2,7>
-  3376054379U, // <0,2,5,u>: Cost 3 vmrglw <3,4,0,5>, LHS
+  2302312555U, // <0,2,5,u>: Cost 3 vmrglw <3,4,0,5>, LHS
   3709100134U, // <0,2,6,0>: Cost 4 vsldoi4 <3,0,2,6>, LHS
   3709100950U, // <0,2,6,1>: Cost 4 vsldoi4 <3,0,2,6>, <1,2,3,0>
   3709102010U, // <0,2,6,2>: Cost 4 vsldoi4 <3,0,2,6>, <2,6,3,7>
-  3832727482U, // <0,2,6,3>: Cost 3 vsldoi12 <1,2,3,0>, <2,6,3,7>
+  2758985658U, // <0,2,6,3>: Cost 3 vsldoi12 <1,2,3,0>, <2,6,3,7>
   3709103414U, // <0,2,6,4>: Cost 4 vsldoi4 <3,0,2,6>, RHS
   3732992098U, // <0,2,6,5>: Cost 4 vsldoi4 <7,0,2,6>, <5,6,7,0>
   3292374970U, // <0,2,6,6>: Cost 4 vmrghw <0,6,0,7>, <2,6,3,7>
   3798594383U, // <0,2,6,7>: Cost 4 vsldoi8 <6,7,0,2>, <6,7,0,2>
-  3832727527U, // <0,2,6,u>: Cost 3 vsldoi12 <1,2,3,0>, <2,6,u,7>
+  2758985703U, // <0,2,6,u>: Cost 3 vsldoi12 <1,2,3,0>, <2,6,u,7>
   3788641274U, // <0,2,7,0>: Cost 4 vsldoi8 <5,1,0,2>, <7,0,1,2>
   3377398508U, // <0,2,7,1>: Cost 4 vmrglw <3,6,0,7>, <1,0,2,1>
   3377398590U, // <0,2,7,2>: Cost 4 vmrglw <3,6,0,7>, <1,1,2,2>
-  3377397862U, // <0,2,7,3>: Cost 3 vmrglw <3,6,0,7>, LHS
+  2303656038U, // <0,2,7,3>: Cost 3 vmrglw <3,6,0,7>, LHS
   3709111606U, // <0,2,7,4>: Cost 4 vsldoi4 <3,0,2,7>, RHS
   3377398836U, // <0,2,7,5>: Cost 4 vmrglw <3,6,0,7>, <1,4,2,5>
   3803903447U, // <0,2,7,6>: Cost 4 vsldoi8 <7,6,0,2>, <7,6,0,2>
   3293054954U, // <0,2,7,7>: Cost 4 vmrghw <0,7,1,0>, <2,7,0,1>
-  3377397867U, // <0,2,7,u>: Cost 3 vmrglw <3,6,0,7>, LHS
-  3293816314U, // <0,2,u,0>: Cost 3 vmrghw LHS, <2,0,u,0>
-  3293816351U, // <0,2,u,1>: Cost 3 vmrghw LHS, <2,1,3,1>
-  2220074600U, // <0,2,u,2>: Cost 2 vmrghw LHS, <2,2,2,2>
-  2220074662U, // <0,2,u,3>: Cost 2 vmrghw LHS, <2,3,0,1>
-  3293816643U, // <0,2,u,4>: Cost 3 vmrghw LHS, <2,4,u,5>
-  3293816725U, // <0,2,u,5>: Cost 3 vmrghw LHS, <2,5,u,6>
-  2220074938U, // <0,2,u,6>: Cost 2 vmrghw LHS, <2,6,3,7>
-  3293816810U, // <0,2,u,7>: Cost 3 vmrghw LHS, <2,7,0,1>
-  2220075067U, // <0,2,u,u>: Cost 2 vmrghw LHS, <2,u,0,1>
-  3703152640U, // <0,3,0,0>: Cost 3 vsldoi4 <2,0,3,0>, <0,0,0,0>
-  3827271830U, // <0,3,0,1>: Cost 3 vsldoi12 <0,3,1,0>, <3,0,1,2>
-  3703154125U, // <0,3,0,2>: Cost 3 vsldoi4 <2,0,3,0>, <2,0,3,0>
-  3288336796U, // <0,3,0,3>: Cost 3 vmrghw <0,0,0,0>, <3,3,3,3>
-  3832727732U, // <0,3,0,4>: Cost 3 vsldoi12 <1,2,3,0>, <3,0,4,5>
+  2303656043U, // <0,2,7,u>: Cost 3 vmrglw <3,6,0,7>, LHS
+  2220074490U, // <0,2,u,0>: Cost 3 vmrghw LHS, <2,0,u,0>
+  2220074527U, // <0,2,u,1>: Cost 3 vmrghw LHS, <2,1,3,1>
+  1146332776U, // <0,2,u,2>: Cost 2 vmrghw LHS, <2,2,2,2>
+  1146332838U, // <0,2,u,3>: Cost 2 vmrghw LHS, <2,3,0,1>
+  2220074819U, // <0,2,u,4>: Cost 3 vmrghw LHS, <2,4,u,5>
+  2220074901U, // <0,2,u,5>: Cost 3 vmrghw LHS, <2,5,u,6>
+  1146333114U, // <0,2,u,6>: Cost 2 vmrghw LHS, <2,6,3,7>
+  2220074986U, // <0,2,u,7>: Cost 3 vmrghw LHS, <2,7,0,1>
+  1146333243U, // <0,2,u,u>: Cost 2 vmrghw LHS, <2,u,0,1>
+  2629410816U, // <0,3,0,0>: Cost 3 vsldoi4 <2,0,3,0>, <0,0,0,0>
+  2753530006U, // <0,3,0,1>: Cost 3 vsldoi12 <0,3,1,0>, <3,0,1,2>
+  2629412301U, // <0,3,0,2>: Cost 3 vsldoi4 <2,0,3,0>, <2,0,3,0>
+  2214594972U, // <0,3,0,3>: Cost 3 vmrghw <0,0,0,0>, <3,3,3,3>
+  2758985908U, // <0,3,0,4>: Cost 3 vsldoi12 <1,2,3,0>, <3,0,4,5>
   3733016674U, // <0,3,0,5>: Cost 4 vsldoi4 <7,0,3,0>, <5,6,7,0>
   3777364488U, // <0,3,0,6>: Cost 4 vsldoi8 <3,2,0,3>, <0,6,3,7>
-  3355445178U, // <0,3,0,7>: Cost 3 vmrglw <0,0,0,0>, <2,6,3,7>
-  3832727765U, // <0,3,0,u>: Cost 3 vsldoi12 <1,2,3,0>, <3,0,u,2>
-  2215471254U, // <0,3,1,0>: Cost 2 vmrghw LHS, <3,0,1,2>
-  3289213158U, // <0,3,1,1>: Cost 3 vmrghw LHS, <3,1,1,1>
-  3289213249U, // <0,3,1,2>: Cost 3 vmrghw LHS, <3,2,2,2>
-  2215471516U, // <0,3,1,3>: Cost 2 vmrghw LHS, <3,3,3,3>
-  2215471618U, // <0,3,1,4>: Cost 2 vmrghw LHS, <3,4,5,6>
-  3289172562U, // <0,3,1,5>: Cost 3 vmrghw LHS, <3,5,5,5>
-  3289172600U, // <0,3,1,6>: Cost 3 vmrghw LHS, <3,6,0,7>
-  3369387962U, // <0,3,1,7>: Cost 3 vmrglw <2,3,0,1>, <2,6,3,7>
-  2215471902U, // <0,3,1,u>: Cost 2 vmrghw LHS, <3,u,1,2>
-  3832727856U, // <0,3,2,0>: Cost 3 vsldoi12 <1,2,3,0>, <3,2,0,3>
+  2281703354U, // <0,3,0,7>: Cost 3 vmrglw <0,0,0,0>, <2,6,3,7>
+  2758985941U, // <0,3,0,u>: Cost 3 vsldoi12 <1,2,3,0>, <3,0,u,2>
+  1141729430U, // <0,3,1,0>: Cost 2 vmrghw LHS, <3,0,1,2>
+  2215471334U, // <0,3,1,1>: Cost 3 vmrghw LHS, <3,1,1,1>
+  2215471425U, // <0,3,1,2>: Cost 3 vmrghw LHS, <3,2,2,2>
+  1141729692U, // <0,3,1,3>: Cost 2 vmrghw LHS, <3,3,3,3>
+  1141729794U, // <0,3,1,4>: Cost 2 vmrghw LHS, <3,4,5,6>
+  2215430738U, // <0,3,1,5>: Cost 3 vmrghw LHS, <3,5,5,5>
+  2215430776U, // <0,3,1,6>: Cost 3 vmrghw LHS, <3,6,0,7>
+  2295646138U, // <0,3,1,7>: Cost 3 vmrglw <2,3,0,1>, <2,6,3,7>
+  1141730078U, // <0,3,1,u>: Cost 2 vmrghw LHS, <3,u,1,2>
+  2758986032U, // <0,3,2,0>: Cost 3 vsldoi12 <1,2,3,0>, <3,2,0,3>
   3709141910U, // <0,3,2,1>: Cost 4 vsldoi4 <3,0,3,2>, <1,2,3,0>
   3289753921U, // <0,3,2,2>: Cost 4 vmrghw <0,2,1,2>, <3,2,2,2>
-  3844671816U, // <0,3,2,3>: Cost 3 vsldoi12 <3,2,3,0>, <3,2,3,0>
+  2770929992U, // <0,3,2,3>: Cost 3 vsldoi12 <3,2,3,0>, <3,2,3,0>
   3289754114U, // <0,3,2,4>: Cost 4 vmrghw <0,2,1,2>, <3,4,5,6>
   3362095460U, // <0,3,2,5>: Cost 5 vmrglw <1,1,0,2>, <0,4,3,5>
   3832727910U, // <0,3,2,6>: Cost 4 vsldoi12 <1,2,3,0>, <3,2,6,3>
   3365414842U, // <0,3,2,7>: Cost 4 vmrglw <1,6,0,2>, <2,6,3,7>
-  3845040501U, // <0,3,2,u>: Cost 3 vsldoi12 <3,2,u,0>, <3,2,u,0>
-  3290400918U, // <0,3,3,0>: Cost 3 vmrghw <0,3,1,0>, <3,0,1,2>
+  2771298677U, // <0,3,2,u>: Cost 3 vsldoi12 <3,2,u,0>, <3,2,u,0>
+  2216659094U, // <0,3,3,0>: Cost 3 vmrghw <0,3,1,0>, <3,0,1,2>
   3290409190U, // <0,3,3,1>: Cost 4 vmrghw <0,3,1,1>, <3,1,1,1>
-  3777366320U, // <0,3,3,2>: Cost 3 vsldoi8 <3,2,0,3>, <3,2,0,3>
-  3290425756U, // <0,3,3,3>: Cost 3 vmrghw <0,3,1,3>, <3,3,3,3>
-  3290434050U, // <0,3,3,4>: Cost 3 vmrghw <0,3,1,4>, <3,4,5,6>
+  2703624496U, // <0,3,3,2>: Cost 3 vsldoi8 <3,2,0,3>, <3,2,0,3>
+  2216683932U, // <0,3,3,3>: Cost 3 vmrghw <0,3,1,3>, <3,3,3,3>
+  2216692226U, // <0,3,3,4>: Cost 3 vmrghw <0,3,1,4>, <3,4,5,6>
   3733041250U, // <0,3,3,5>: Cost 4 vsldoi4 <7,0,3,3>, <5,6,7,0>
   3832727988U, // <0,3,3,6>: Cost 4 vsldoi12 <1,2,3,0>, <3,3,6,0>
   3374712762U, // <0,3,3,7>: Cost 4 vmrglw <3,2,0,3>, <2,6,3,7>
-  3290467102U, // <0,3,3,u>: Cost 3 vmrghw <0,3,1,u>, <3,u,1,2>
-  3291105430U, // <0,3,4,0>: Cost 3 vmrghw <0,4,1,5>, <3,0,1,2>
+  2216725278U, // <0,3,3,u>: Cost 3 vmrghw <0,3,1,u>, <3,u,1,2>
+  2217363606U, // <0,3,4,0>: Cost 3 vmrghw <0,4,1,5>, <3,0,1,2>
   3291105510U, // <0,3,4,1>: Cost 4 vmrghw <0,4,1,5>, <3,1,1,1>
   3291105601U, // <0,3,4,2>: Cost 4 vmrghw <0,4,1,5>, <3,2,2,2>
-  3291105692U, // <0,3,4,3>: Cost 3 vmrghw <0,4,1,5>, <3,3,3,3>
-  3291105794U, // <0,3,4,4>: Cost 3 vmrghw <0,4,1,5>, <3,4,5,6>
-  3832728066U, // <0,3,4,5>: Cost 3 vsldoi12 <1,2,3,0>, <3,4,5,6>
+  2217363868U, // <0,3,4,3>: Cost 3 vmrghw <0,4,1,5>, <3,3,3,3>
+  2217363970U, // <0,3,4,4>: Cost 3 vmrghw <0,4,1,5>, <3,4,5,6>
+  2758986242U, // <0,3,4,5>: Cost 3 vsldoi12 <1,2,3,0>, <3,4,5,6>
   3727077685U, // <0,3,4,6>: Cost 4 vsldoi4 <6,0,3,4>, <6,0,3,4>
   3364767674U, // <0,3,4,7>: Cost 4 vmrglw <1,5,0,4>, <2,6,3,7>
-  3291106078U, // <0,3,4,u>: Cost 3 vmrghw <0,4,1,5>, <3,u,1,2>
+  2217364254U, // <0,3,4,u>: Cost 3 vmrghw <0,4,1,5>, <3,u,1,2>
   3832728102U, // <0,3,5,0>: Cost 4 vsldoi12 <1,2,3,0>, <3,5,0,6>
   3405916003U, // <0,3,5,1>: Cost 4 vmrglw <u,4,0,5>, <2,5,3,1>
   3376055840U, // <0,3,5,2>: Cost 4 vmrglw <3,4,0,5>, <2,1,3,2>
   3376055679U, // <0,3,5,3>: Cost 4 vmrglw <3,4,0,5>, <1,u,3,3>
   3376055194U, // <0,3,5,4>: Cost 4 vmrglw <3,4,0,5>, <1,2,3,4>
   3859565138U, // <0,3,5,5>: Cost 4 vsldoi12 <5,6,7,0>, <3,5,5,5>
-  3801256034U, // <0,3,5,6>: Cost 3 vsldoi8 <7,2,0,3>, <5,6,7,0>
+  2727514210U, // <0,3,5,6>: Cost 3 vsldoi8 <7,2,0,3>, <5,6,7,0>
   3376056250U, // <0,3,5,7>: Cost 4 vmrglw <3,4,0,5>, <2,6,3,7>
-  3801256034U, // <0,3,5,u>: Cost 3 vsldoi8 <7,2,0,3>, <5,6,7,0>
-  3832728184U, // <0,3,6,0>: Cost 3 vsldoi12 <1,2,3,0>, <3,6,0,7>
+  2727514210U, // <0,3,5,u>: Cost 3 vsldoi8 <7,2,0,3>, <5,6,7,0>
+  2758986360U, // <0,3,6,0>: Cost 3 vsldoi12 <1,2,3,0>, <3,6,0,7>
   3709174678U, // <0,3,6,1>: Cost 4 vsldoi4 <3,0,3,6>, <1,2,3,0>
   3795284411U, // <0,3,6,2>: Cost 4 vsldoi8 <6,2,0,3>, <6,2,0,3>
   3709175980U, // <0,3,6,3>: Cost 4 vsldoi4 <3,0,3,6>, <3,0,3,6>
   3833096860U, // <0,3,6,4>: Cost 4 vsldoi12 <1,2,u,0>, <3,6,4,7>
   3376728235U, // <0,3,6,5>: Cost 5 vmrglw <3,5,0,6>, <3,0,3,5>
   3859565229U, // <0,3,6,6>: Cost 4 vsldoi12 <5,6,7,0>, <3,6,6,6>
-  3847621296U, // <0,3,6,7>: Cost 3 vsldoi12 <3,6,7,0>, <3,6,7,0>
-  3832728184U, // <0,3,6,u>: Cost 3 vsldoi12 <1,2,3,0>, <3,6,0,7>
-  3377398678U, // <0,3,7,0>: Cost 3 vmrglw <3,6,0,7>, <1,2,3,0>
+  2773879472U, // <0,3,6,7>: Cost 3 vsldoi12 <3,6,7,0>, <3,6,7,0>
+  2758986360U, // <0,3,6,u>: Cost 3 vsldoi12 <1,2,3,0>, <3,6,0,7>
+  2303656854U, // <0,3,7,0>: Cost 3 vmrglw <3,6,0,7>, <1,2,3,0>
   3807229018U, // <0,3,7,1>: Cost 4 vsldoi8 <u,2,0,3>, <7,1,2,u>
-  3801257108U, // <0,3,7,2>: Cost 3 vsldoi8 <7,2,0,3>, <7,2,0,3>
+  2727515284U, // <0,3,7,2>: Cost 3 vsldoi8 <7,2,0,3>, <7,2,0,3>
   3377399410U, // <0,3,7,3>: Cost 4 vmrglw <3,6,0,7>, <2,2,3,3>
   3377398682U, // <0,3,7,4>: Cost 4 vmrglw <3,6,0,7>, <1,2,3,4>
   3801257409U, // <0,3,7,5>: Cost 4 vsldoi8 <7,2,0,3>, <7,5,6,7>
   3377399980U, // <0,3,7,6>: Cost 4 vmrglw <3,6,0,7>, <3,0,3,6>
   3375409082U, // <0,3,7,7>: Cost 4 vmrglw <3,3,0,7>, <2,6,3,7>
-  3805238906U, // <0,3,7,u>: Cost 3 vsldoi8 <7,u,0,3>, <7,u,0,3>
-  2220075158U, // <0,3,u,0>: Cost 2 vmrghw LHS, <3,0,1,2>
-  3293817062U, // <0,3,u,1>: Cost 3 vmrghw LHS, <3,1,1,1>
-  3293817153U, // <0,3,u,2>: Cost 3 vmrghw LHS, <3,2,2,2>
-  2220075420U, // <0,3,u,3>: Cost 2 vmrghw LHS, <3,3,3,3>
-  2220075522U, // <0,3,u,4>: Cost 2 vmrghw LHS, <3,4,5,6>
-  3832728390U, // <0,3,u,5>: Cost 3 vsldoi12 <1,2,3,0>, <3,u,5,6>
-  3877481296U, // <0,3,u,6>: Cost 3 vsldoi12 <u,6,7,0>, <3,u,6,7>
-  3369445306U, // <0,3,u,7>: Cost 3 vmrglw <2,3,0,u>, <2,6,3,7>
-  2220075806U, // <0,3,u,u>: Cost 2 vmrghw LHS, <3,u,1,2>
-  3288337297U, // <0,4,0,0>: Cost 3 vmrghw <0,0,0,0>, <4,0,5,0>
-  3767418982U, // <0,4,0,1>: Cost 3 vsldoi8 <1,5,0,4>, LHS
+  2731497082U, // <0,3,7,u>: Cost 3 vsldoi8 <7,u,0,3>, <7,u,0,3>
+  1146333334U, // <0,3,u,0>: Cost 2 vmrghw LHS, <3,0,1,2>
+  2220075238U, // <0,3,u,1>: Cost 3 vmrghw LHS, <3,1,1,1>
+  2220075329U, // <0,3,u,2>: Cost 3 vmrghw LHS, <3,2,2,2>
+  1146333596U, // <0,3,u,3>: Cost 2 vmrghw LHS, <3,3,3,3>
+  1146333698U, // <0,3,u,4>: Cost 2 vmrghw LHS, <3,4,5,6>
+  2758986566U, // <0,3,u,5>: Cost 3 vsldoi12 <1,2,3,0>, <3,u,5,6>
+  2803739472U, // <0,3,u,6>: Cost 3 vsldoi12 <u,6,7,0>, <3,u,6,7>
+  2295703482U, // <0,3,u,7>: Cost 3 vmrglw <2,3,0,u>, <2,6,3,7>
+  1146333982U, // <0,3,u,u>: Cost 2 vmrghw LHS, <3,u,1,2>
+  2214595473U, // <0,4,0,0>: Cost 3 vmrghw <0,0,0,0>, <4,0,5,0>
+  2693677158U, // <0,4,0,1>: Cost 3 vsldoi8 <1,5,0,4>, LHS
   3839437689U, // <0,4,0,2>: Cost 4 vsldoi12 <2,3,4,0>, <4,0,2,3>
   3709200559U, // <0,4,0,3>: Cost 4 vsldoi4 <3,0,4,0>, <3,0,4,0>
-  3767419218U, // <0,4,0,4>: Cost 3 vsldoi8 <1,5,0,4>, <0,4,1,5>
-  2214595894U, // <0,4,0,5>: Cost 2 vmrghw <0,0,0,0>, RHS
+  2693677394U, // <0,4,0,4>: Cost 3 vsldoi8 <1,5,0,4>, <0,4,1,5>
+  1140854070U, // <0,4,0,5>: Cost 2 vmrghw <0,0,0,0>, RHS
   3767419409U, // <0,4,0,6>: Cost 4 vsldoi8 <1,5,0,4>, <0,6,4,7>
   3854109604U, // <0,4,0,7>: Cost 4 vsldoi12 <4,7,5,0>, <4,0,7,1>
-  2214596137U, // <0,4,0,u>: Cost 2 vmrghw <0,0,0,0>, RHS
-  2215431058U, // <0,4,1,0>: Cost 2 vmrghw LHS, <4,0,5,1>
-  3289172938U, // <0,4,1,1>: Cost 3 vmrghw LHS, <4,1,2,3>
-  3289173045U, // <0,4,1,2>: Cost 3 vmrghw LHS, <4,2,5,2>
-  3709208752U, // <0,4,1,3>: Cost 3 vsldoi4 <3,0,4,1>, <3,0,4,1>
-  2215431376U, // <0,4,1,4>: Cost 2 vmrghw LHS, <4,4,4,4>
-  1141689654U, // <0,4,1,5>: Cost 1 vmrghw LHS, RHS
-  3289173369U, // <0,4,1,6>: Cost 3 vmrghw LHS, <4,6,5,2>
-  3733099540U, // <0,4,1,7>: Cost 3 vsldoi4 <7,0,4,1>, <7,0,4,1>
-  1141689897U, // <0,4,1,u>: Cost 1 vmrghw LHS, RHS
+  1140854313U, // <0,4,0,u>: Cost 2 vmrghw <0,0,0,0>, RHS
+  1141689234U, // <0,4,1,0>: Cost 2 vmrghw LHS, <4,0,5,1>
+  2215431114U, // <0,4,1,1>: Cost 3 vmrghw LHS, <4,1,2,3>
+  2215431221U, // <0,4,1,2>: Cost 3 vmrghw LHS, <4,2,5,2>
+  2635466928U, // <0,4,1,3>: Cost 3 vsldoi4 <3,0,4,1>, <3,0,4,1>
+  1141689552U, // <0,4,1,4>: Cost 2 vmrghw LHS, <4,4,4,4>
+  67947830U,   // <0,4,1,5>: Cost 1 vmrghw LHS, RHS
+  2215431545U, // <0,4,1,6>: Cost 3 vmrghw LHS, <4,6,5,2>
+  2659357716U, // <0,4,1,7>: Cost 3 vsldoi4 <7,0,4,1>, <7,0,4,1>
+  67948073U,   // <0,4,1,u>: Cost 1 vmrghw LHS, RHS
   3767420369U, // <0,4,2,0>: Cost 4 vsldoi8 <1,5,0,4>, <2,0,3,4>
   3767420451U, // <0,4,2,1>: Cost 4 vsldoi8 <1,5,0,4>, <2,1,3,5>
   3767420520U, // <0,4,2,2>: Cost 4 vsldoi8 <1,5,0,4>, <2,2,2,2>
-  3772065449U, // <0,4,2,3>: Cost 3 vsldoi8 <2,3,0,4>, <2,3,0,4>
+  2698323625U, // <0,4,2,3>: Cost 3 vsldoi8 <2,3,0,4>, <2,3,0,4>
   3709218102U, // <0,4,2,4>: Cost 4 vsldoi4 <3,0,4,2>, RHS
-  3289754934U, // <0,4,2,5>: Cost 3 vmrghw <0,2,1,2>, RHS
+  2216013110U, // <0,4,2,5>: Cost 3 vmrghw <0,2,1,2>, RHS
   3767420858U, // <0,4,2,6>: Cost 4 vsldoi8 <1,5,0,4>, <2,6,3,7>
   3774719981U, // <0,4,2,7>: Cost 4 vsldoi8 <2,7,0,4>, <2,7,0,4>
-  3289755177U, // <0,4,2,u>: Cost 3 vmrghw <0,2,1,2>, RHS
+  2216013353U, // <0,4,2,u>: Cost 3 vmrghw <0,2,1,2>, RHS
   3767421078U, // <0,4,3,0>: Cost 4 vsldoi8 <1,5,0,4>, <3,0,1,2>
   3776710880U, // <0,4,3,1>: Cost 4 vsldoi8 <3,1,0,4>, <3,1,0,4>
   3833097325U, // <0,4,3,2>: Cost 5 vsldoi12 <1,2,u,0>, <4,3,2,4>
   3767421340U, // <0,4,3,3>: Cost 4 vsldoi8 <1,5,0,4>, <3,3,3,3>
   3767421442U, // <0,4,3,4>: Cost 4 vsldoi8 <1,5,0,4>, <3,4,5,6>
-  3290402102U, // <0,4,3,5>: Cost 3 vmrghw <0,3,1,0>, RHS
+  2216660278U, // <0,4,3,5>: Cost 3 vmrghw <0,3,1,0>, RHS
   3833097361U, // <0,4,3,6>: Cost 5 vsldoi12 <1,2,u,0>, <4,3,6,4>
   3780692678U, // <0,4,3,7>: Cost 4 vsldoi8 <3,7,0,4>, <3,7,0,4>
-  3290402345U, // <0,4,3,u>: Cost 3 vmrghw <0,3,1,0>, RHS
-  3691315240U, // <0,4,4,0>: Cost 3 vsldoi4 <0,0,4,4>, <0,0,4,4>
-  3291106274U, // <0,4,4,1>: Cost 3 vmrghw <0,4,1,5>, <4,1,5,0>
+  2216660521U, // <0,4,3,u>: Cost 3 vmrghw <0,3,1,0>, RHS
+  2617573416U, // <0,4,4,0>: Cost 3 vsldoi4 <0,0,4,4>, <0,0,4,4>
+  2217364450U, // <0,4,4,1>: Cost 3 vmrghw <0,4,1,5>, <4,1,5,0>
   3691316771U, // <0,4,4,2>: Cost 4 vsldoi4 <0,0,4,4>, <2,1,3,5>
   3709233331U, // <0,4,4,3>: Cost 4 vsldoi4 <3,0,4,4>, <3,0,4,4>
-  3859565776U, // <0,4,4,4>: Cost 3 vsldoi12 <5,6,7,0>, <4,4,4,4>
-  2217364790U, // <0,4,4,5>: Cost 2 vmrghw <0,4,1,5>, RHS
+  2785823952U, // <0,4,4,4>: Cost 3 vsldoi12 <5,6,7,0>, <4,4,4,4>
+  1143622966U, // <0,4,4,5>: Cost 2 vmrghw <0,4,1,5>, RHS
   3691319723U, // <0,4,4,6>: Cost 4 vsldoi4 <0,0,4,4>, <6,1,7,5>
   3854109932U, // <0,4,4,7>: Cost 4 vsldoi12 <4,7,5,0>, <4,4,7,5>
-  2217365033U, // <0,4,4,u>: Cost 2 vmrghw <0,4,1,5>, RHS
-  3709239398U, // <0,4,5,0>: Cost 3 vsldoi4 <3,0,4,5>, LHS
-  3709240214U, // <0,4,5,1>: Cost 3 vsldoi4 <3,0,4,5>, <1,2,3,0>
+  1143623209U, // <0,4,4,u>: Cost 2 vmrghw <0,4,1,5>, RHS
+  2635497574U, // <0,4,5,0>: Cost 3 vsldoi4 <3,0,4,5>, LHS
+  2635498390U, // <0,4,5,1>: Cost 3 vsldoi4 <3,0,4,5>, <1,2,3,0>
   3709240936U, // <0,4,5,2>: Cost 4 vsldoi4 <3,0,4,5>, <2,2,2,2>
-  3709241524U, // <0,4,5,3>: Cost 3 vsldoi4 <3,0,4,5>, <3,0,4,5>
-  3709242678U, // <0,4,5,4>: Cost 3 vsldoi4 <3,0,4,5>, RHS
-  3859565868U, // <0,4,5,5>: Cost 3 vsldoi12 <5,6,7,0>, <4,5,5,6>
-  2758987062U, // <0,4,5,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
-  3733132312U, // <0,4,5,7>: Cost 3 vsldoi4 <7,0,4,5>, <7,0,4,5>
-  2758987080U, // <0,4,5,u>: Cost 2 vsldoi12 <1,2,3,0>, RHS
+  2635499700U, // <0,4,5,3>: Cost 3 vsldoi4 <3,0,4,5>, <3,0,4,5>
+  2635500854U, // <0,4,5,4>: Cost 3 vsldoi4 <3,0,4,5>, RHS
+  2785824044U, // <0,4,5,5>: Cost 3 vsldoi12 <5,6,7,0>, <4,5,5,6>
+  1685245238U, // <0,4,5,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
+  2659390488U, // <0,4,5,7>: Cost 3 vsldoi4 <7,0,4,5>, <7,0,4,5>
+  1685245256U, // <0,4,5,u>: Cost 2 vsldoi12 <1,2,3,0>, RHS
   3839438161U, // <0,4,6,0>: Cost 4 vsldoi12 <2,3,4,0>, <4,6,0,7>
   3798610347U, // <0,4,6,1>: Cost 4 vsldoi8 <6,7,0,4>, <6,1,7,5>
   3798610426U, // <0,4,6,2>: Cost 4 vsldoi8 <6,7,0,4>, <6,2,7,3>
   3795956237U, // <0,4,6,3>: Cost 4 vsldoi8 <6,3,0,4>, <6,3,0,4>
   3733138742U, // <0,4,6,4>: Cost 4 vsldoi4 <7,0,4,6>, RHS
-  3292376374U, // <0,4,6,5>: Cost 3 vmrghw <0,6,0,7>, RHS
+  2218634550U, // <0,4,6,5>: Cost 3 vmrghw <0,6,0,7>, RHS
   3798610744U, // <0,4,6,6>: Cost 4 vsldoi8 <6,7,0,4>, <6,6,6,6>
-  3798610769U, // <0,4,6,7>: Cost 3 vsldoi8 <6,7,0,4>, <6,7,0,4>
-  3799274402U, // <0,4,6,u>: Cost 3 vsldoi8 <6,u,0,4>, <6,u,0,4>
+  2724868945U, // <0,4,6,7>: Cost 3 vsldoi8 <6,7,0,4>, <6,7,0,4>
+  2725532578U, // <0,4,6,u>: Cost 3 vsldoi8 <6,u,0,4>, <6,u,0,4>
   3383371465U, // <0,4,7,0>: Cost 4 vmrglw <4,6,0,7>, <2,3,4,0>
   3800601668U, // <0,4,7,1>: Cost 4 vsldoi8 <7,1,0,4>, <7,1,0,4>
   3775386826U, // <0,4,7,2>: Cost 5 vsldoi8 <2,u,0,4>, <7,2,6,3>
   3801928934U, // <0,4,7,3>: Cost 4 vsldoi8 <7,3,0,4>, <7,3,0,4>
   3721202998U, // <0,4,7,4>: Cost 4 vsldoi4 <5,0,4,7>, RHS
-  3854110152U, // <0,4,7,5>: Cost 3 vsldoi12 <4,7,5,0>, <4,7,5,0>
+  2780368328U, // <0,4,7,5>: Cost 3 vsldoi12 <4,7,5,0>, <4,7,5,0>
   3383372686U, // <0,4,7,6>: Cost 5 vmrglw <4,6,0,7>, <4,0,4,6>
   3854110170U, // <0,4,7,7>: Cost 4 vsldoi12 <4,7,5,0>, <4,7,7,0>
-  3854110152U, // <0,4,7,u>: Cost 3 vsldoi12 <4,7,5,0>, <4,7,5,0>
-  2220075922U, // <0,4,u,0>: Cost 2 vmrghw LHS, <4,0,5,1>
-  3293817826U, // <0,4,u,1>: Cost 3 vmrghw LHS, <4,1,5,0>
-  3293817909U, // <0,4,u,2>: Cost 3 vmrghw LHS, <4,2,5,2>
-  3709266103U, // <0,4,u,3>: Cost 3 vsldoi4 <3,0,4,u>, <3,0,4,u>
-  2220076240U, // <0,4,u,4>: Cost 2 vmrghw LHS, <4,4,4,4>
-  1146334518U, // <0,4,u,5>: Cost 1 vmrghw LHS, RHS
-  2758987305U, // <0,4,u,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
-  3733156891U, // <0,4,u,7>: Cost 3 vsldoi4 <7,0,4,u>, <7,0,4,u>
-  1146334761U, // <0,4,u,u>: Cost 1 vmrghw LHS, RHS
-  3355446161U, // <0,5,0,0>: Cost 3 vmrglw <0,0,0,0>, <4,0,5,0>
-  3778707558U, // <0,5,0,1>: Cost 3 vsldoi8 <3,4,0,5>, LHS
+  2780368328U, // <0,4,7,u>: Cost 3 vsldoi12 <4,7,5,0>, <4,7,5,0>
+  1146334098U, // <0,4,u,0>: Cost 2 vmrghw LHS, <4,0,5,1>
+  2220076002U, // <0,4,u,1>: Cost 3 vmrghw LHS, <4,1,5,0>
+  2220076085U, // <0,4,u,2>: Cost 3 vmrghw LHS, <4,2,5,2>
+  2635524279U, // <0,4,u,3>: Cost 3 vsldoi4 <3,0,4,u>, <3,0,4,u>
+  1146334416U, // <0,4,u,4>: Cost 2 vmrghw LHS, <4,4,4,4>
+  72592694U,   // <0,4,u,5>: Cost 1 vmrghw LHS, RHS
+  1685245481U, // <0,4,u,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
+  2659415067U, // <0,4,u,7>: Cost 3 vsldoi4 <7,0,4,u>, <7,0,4,u>
+  72592937U,   // <0,4,u,u>: Cost 1 vmrghw LHS, RHS
+  2281704337U, // <0,5,0,0>: Cost 3 vmrglw <0,0,0,0>, <4,0,5,0>
+  2704965734U, // <0,5,0,1>: Cost 3 vsldoi8 <3,4,0,5>, LHS
   3778707666U, // <0,5,0,2>: Cost 4 vsldoi8 <3,4,0,5>, <0,2,5,3>
   3778707708U, // <0,5,0,3>: Cost 4 vsldoi8 <3,4,0,5>, <0,3,1,0>
-  3760791881U, // <0,5,0,4>: Cost 3 vsldoi8 <0,4,0,5>, <0,4,0,5>
-  3288338436U, // <0,5,0,5>: Cost 3 vmrghw <0,0,0,0>, <5,5,5,5>
-  3859566196U, // <0,5,0,6>: Cost 3 vsldoi12 <5,6,7,0>, <5,0,6,1>
+  2687050057U, // <0,5,0,4>: Cost 3 vsldoi8 <0,4,0,5>, <0,4,0,5>
+  2214596612U, // <0,5,0,5>: Cost 3 vmrghw <0,0,0,0>, <5,5,5,5>
+  2785824372U, // <0,5,0,6>: Cost 3 vsldoi12 <5,6,7,0>, <5,0,6,1>
   3854110332U, // <0,5,0,7>: Cost 4 vsldoi12 <4,7,5,0>, <5,0,7,0>
-  3778708125U, // <0,5,0,u>: Cost 3 vsldoi8 <3,4,0,5>, LHS
-  2641510502U, // <0,5,1,0>: Cost 2 vsldoi4 <4,0,5,1>, LHS
-  3385978394U, // <0,5,1,1>: Cost 3 vmrglw <5,1,0,1>, <4,u,5,1>
-  3289173739U, // <0,5,1,2>: Cost 3 vmrghw LHS, <5,2,1,3>
-  3715254422U, // <0,5,1,3>: Cost 3 vsldoi4 <4,0,5,1>, <3,0,1,2>
-  2641513362U, // <0,5,1,4>: Cost 2 vsldoi4 <4,0,5,1>, <4,0,5,1>
-  2215432196U, // <0,5,1,5>: Cost 2 vmrghw LHS, <5,5,5,5>
-  2215432290U, // <0,5,1,6>: Cost 2 vmrghw LHS, <5,6,7,0>
-  3715257338U, // <0,5,1,7>: Cost 3 vsldoi4 <4,0,5,1>, <7,0,1,2>
-  2215432439U, // <0,5,1,u>: Cost 2 vmrghw LHS, <5,u,5,5>
+  2704966301U, // <0,5,0,u>: Cost 3 vsldoi8 <3,4,0,5>, LHS
+  1567768678U, // <0,5,1,0>: Cost 2 vsldoi4 <4,0,5,1>, LHS
+  2312236570U, // <0,5,1,1>: Cost 3 vmrglw <5,1,0,1>, <4,u,5,1>
+  2215431915U, // <0,5,1,2>: Cost 3 vmrghw LHS, <5,2,1,3>
+  2641512598U, // <0,5,1,3>: Cost 3 vsldoi4 <4,0,5,1>, <3,0,1,2>
+  1567771538U, // <0,5,1,4>: Cost 2 vsldoi4 <4,0,5,1>, <4,0,5,1>
+  1141690372U, // <0,5,1,5>: Cost 2 vmrghw LHS, <5,5,5,5>
+  1141690466U, // <0,5,1,6>: Cost 2 vmrghw LHS, <5,6,7,0>
+  2641515514U, // <0,5,1,7>: Cost 3 vsldoi4 <4,0,5,1>, <7,0,1,2>
+  1141690615U, // <0,5,1,u>: Cost 2 vmrghw LHS, <5,u,5,5>
   3772736973U, // <0,5,2,0>: Cost 4 vsldoi8 <2,4,0,5>, <2,0,3,0>
   3778709024U, // <0,5,2,1>: Cost 4 vsldoi8 <3,4,0,5>, <2,1,3,2>
   3778709096U, // <0,5,2,2>: Cost 4 vsldoi8 <3,4,0,5>, <2,2,2,2>
@@ -453,78 +453,78 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3778709434U, // <0,5,2,6>: Cost 4 vsldoi8 <3,4,0,5>, <2,6,3,7>
   3805251562U, // <0,5,2,7>: Cost 4 vsldoi8 <7,u,0,5>, <2,7,0,1>
   3775391807U, // <0,5,2,u>: Cost 4 vsldoi8 <2,u,0,5>, <2,u,0,5>
-  3778709654U, // <0,5,3,0>: Cost 3 vsldoi8 <3,4,0,5>, <3,0,1,2>
+  2704967830U, // <0,5,3,0>: Cost 3 vsldoi8 <3,4,0,5>, <3,0,1,2>
   3776719073U, // <0,5,3,1>: Cost 4 vsldoi8 <3,1,0,5>, <3,1,0,5>
   3777382706U, // <0,5,3,2>: Cost 4 vsldoi8 <3,2,0,5>, <3,2,0,5>
   3778709887U, // <0,5,3,3>: Cost 4 vsldoi8 <3,4,0,5>, <3,3,0,1>
-  3778709972U, // <0,5,3,4>: Cost 3 vsldoi8 <3,4,0,5>, <3,4,0,5>
+  2704968148U, // <0,5,3,4>: Cost 3 vsldoi8 <3,4,0,5>, <3,4,0,5>
   3857428317U, // <0,5,3,5>: Cost 4 vsldoi12 <5,3,5,0>, <5,3,5,0>
   3364096514U, // <0,5,3,6>: Cost 4 vmrglw <1,4,0,3>, <3,4,5,6>
   3780700871U, // <0,5,3,7>: Cost 4 vsldoi8 <3,7,0,5>, <3,7,0,5>
-  3781364504U, // <0,5,3,u>: Cost 3 vsldoi8 <3,u,0,5>, <3,u,0,5>
-  3802598290U, // <0,5,4,0>: Cost 3 vsldoi8 <7,4,0,5>, <4,0,5,1>
+  2707622680U, // <0,5,3,u>: Cost 3 vsldoi8 <3,u,0,5>, <3,u,0,5>
+  2728856466U, // <0,5,4,0>: Cost 3 vsldoi8 <7,4,0,5>, <4,0,5,1>
   3697361674U, // <0,5,4,1>: Cost 4 vsldoi4 <1,0,5,4>, <1,0,5,4>
   3697362601U, // <0,5,4,2>: Cost 4 vsldoi4 <1,0,5,4>, <2,3,0,4>
   3364766635U, // <0,5,4,3>: Cost 4 vmrglw <1,5,0,4>, <1,2,5,3>
-  3291107252U, // <0,5,4,4>: Cost 3 vmrghw <0,4,1,5>, <5,4,5,6>
-  3778710838U, // <0,5,4,5>: Cost 3 vsldoi8 <3,4,0,5>, RHS
-  3859566524U, // <0,5,4,6>: Cost 3 vsldoi12 <5,6,7,0>, <5,4,6,5>
+  2217365428U, // <0,5,4,4>: Cost 3 vmrghw <0,4,1,5>, <5,4,5,6>
+  2704969014U, // <0,5,4,5>: Cost 3 vsldoi8 <3,4,0,5>, RHS
+  2785824700U, // <0,5,4,6>: Cost 3 vsldoi12 <5,6,7,0>, <5,4,6,5>
   3364766963U, // <0,5,4,7>: Cost 4 vmrglw <1,5,0,4>, <1,6,5,7>
-  3778711081U, // <0,5,4,u>: Cost 3 vsldoi8 <3,4,0,5>, RHS
+  2704969257U, // <0,5,4,u>: Cost 3 vsldoi8 <3,4,0,5>, RHS
   3846148050U, // <0,5,5,0>: Cost 4 vsldoi12 <3,4,5,0>, <5,5,0,0>
-  3399945106U, // <0,5,5,1>: Cost 3 vmrglw <7,4,0,5>, <4,0,5,1>
+  2326203282U, // <0,5,5,1>: Cost 3 vmrglw <7,4,0,5>, <4,0,5,1>
   3291746027U, // <0,5,5,2>: Cost 4 vmrghw <0,5,1,2>, <5,2,1,3>
   3376054482U, // <0,5,5,3>: Cost 4 vmrglw <3,4,0,5>, <0,2,5,3>
   3790655366U, // <0,5,5,4>: Cost 4 vsldoi8 <5,4,0,5>, <5,4,0,5>
-  3859566596U, // <0,5,5,5>: Cost 3 vsldoi12 <5,6,7,0>, <5,5,5,5>
-  3798618210U, // <0,5,5,6>: Cost 3 vsldoi8 <6,7,0,5>, <5,6,7,0>
+  2785824772U, // <0,5,5,5>: Cost 3 vsldoi12 <5,6,7,0>, <5,5,5,5>
+  2724876386U, // <0,5,5,6>: Cost 3 vsldoi8 <6,7,0,5>, <5,6,7,0>
   3858903057U, // <0,5,5,7>: Cost 4 vsldoi12 <5,5,7,0>, <5,5,7,0>
-  3810562308U, // <0,5,5,u>: Cost 3 vsldoi8 <u,7,0,5>, <5,u,7,0>
-  3733209190U, // <0,5,6,0>: Cost 3 vsldoi4 <7,0,5,6>, LHS
+  2736820484U, // <0,5,5,u>: Cost 3 vsldoi8 <u,7,0,5>, <5,u,7,0>
+  2659467366U, // <0,5,6,0>: Cost 3 vsldoi4 <7,0,5,6>, LHS
   3859566643U, // <0,5,6,1>: Cost 4 vsldoi12 <5,6,7,0>, <5,6,1,7>
   3798618618U, // <0,5,6,2>: Cost 4 vsldoi8 <6,7,0,5>, <6,2,7,3>
   3852857410U, // <0,5,6,3>: Cost 4 vsldoi12 <4,5,6,0>, <5,6,3,4>
-  3733212470U, // <0,5,6,4>: Cost 3 vsldoi4 <7,0,5,6>, RHS
-  3733213282U, // <0,5,6,5>: Cost 3 vsldoi4 <7,0,5,6>, <5,6,7,0>
+  2659470646U, // <0,5,6,4>: Cost 3 vsldoi4 <7,0,5,6>, RHS
+  2659471458U, // <0,5,6,5>: Cost 3 vsldoi4 <7,0,5,6>, <5,6,7,0>
   3832729696U, // <0,5,6,6>: Cost 4 vsldoi12 <1,2,3,0>, <5,6,6,7>
-  2785824866U, // <0,5,6,7>: Cost 2 vsldoi12 <5,6,7,0>, <5,6,7,0>
-  2785898603U, // <0,5,6,u>: Cost 2 vsldoi12 <5,6,u,0>, <5,6,u,0>
-  3805254650U, // <0,5,7,0>: Cost 3 vsldoi8 <7,u,0,5>, <7,0,1,2>
+  1712083042U, // <0,5,6,7>: Cost 2 vsldoi12 <5,6,7,0>, <5,6,7,0>
+  1712156779U, // <0,5,6,u>: Cost 2 vsldoi12 <5,6,u,0>, <5,6,u,0>
+  2731512826U, // <0,5,7,0>: Cost 3 vsldoi8 <7,u,0,5>, <7,0,1,2>
   3859566717U, // <0,5,7,1>: Cost 4 vsldoi12 <5,6,7,0>, <5,7,1,0>
   3798619284U, // <0,5,7,2>: Cost 4 vsldoi8 <6,7,0,5>, <7,2,0,3>
   3778712803U, // <0,5,7,3>: Cost 4 vsldoi8 <3,4,0,5>, <7,3,0,1>
-  3802600760U, // <0,5,7,4>: Cost 3 vsldoi8 <7,4,0,5>, <7,4,0,5>
+  2728858936U, // <0,5,7,4>: Cost 3 vsldoi8 <7,4,0,5>, <7,4,0,5>
   3859566753U, // <0,5,7,5>: Cost 4 vsldoi12 <5,6,7,0>, <5,7,5,0>
   3377398135U, // <0,5,7,6>: Cost 4 vmrglw <3,6,0,7>, <0,4,5,6>
   3798619686U, // <0,5,7,7>: Cost 4 vsldoi8 <6,7,0,5>, <7,7,0,0>
-  3805255292U, // <0,5,7,u>: Cost 3 vsldoi8 <7,u,0,5>, <7,u,0,5>
-  2641567846U, // <0,5,u,0>: Cost 2 vsldoi4 <4,0,5,u>, LHS
-  3778713390U, // <0,5,u,1>: Cost 3 vsldoi8 <3,4,0,5>, LHS
-  3293818603U, // <0,5,u,2>: Cost 3 vmrghw LHS, <5,2,1,3>
-  3715311766U, // <0,5,u,3>: Cost 3 vsldoi4 <4,0,5,u>, <3,0,1,2>
-  2641570713U, // <0,5,u,4>: Cost 2 vsldoi4 <4,0,5,u>, <4,0,5,u>
-  2220077060U, // <0,5,u,5>: Cost 2 vmrghw LHS, <5,5,5,5>
-  2220077154U, // <0,5,u,6>: Cost 2 vmrghw LHS, <5,6,7,0>
-  2787152132U, // <0,5,u,7>: Cost 2 vsldoi12 <5,u,7,0>, <5,u,7,0>
-  2787225869U, // <0,5,u,u>: Cost 2 vsldoi12 <5,u,u,0>, <5,u,u,0>
-  3288338773U, // <0,6,0,0>: Cost 3 vmrghw <0,0,0,0>, <6,0,7,0>
-  3288420775U, // <0,6,0,1>: Cost 3 vmrghw <0,0,1,1>, <6,1,7,1>
-  3288338938U, // <0,6,0,2>: Cost 3 vmrghw <0,0,0,0>, <6,2,7,3>
+  2731513468U, // <0,5,7,u>: Cost 3 vsldoi8 <7,u,0,5>, <7,u,0,5>
+  1567826022U, // <0,5,u,0>: Cost 2 vsldoi4 <4,0,5,u>, LHS
+  2704971566U, // <0,5,u,1>: Cost 3 vsldoi8 <3,4,0,5>, LHS
+  2220076779U, // <0,5,u,2>: Cost 3 vmrghw LHS, <5,2,1,3>
+  2641569942U, // <0,5,u,3>: Cost 3 vsldoi4 <4,0,5,u>, <3,0,1,2>
+  1567828889U, // <0,5,u,4>: Cost 2 vsldoi4 <4,0,5,u>, <4,0,5,u>
+  1146335236U, // <0,5,u,5>: Cost 2 vmrghw LHS, <5,5,5,5>
+  1146335330U, // <0,5,u,6>: Cost 2 vmrghw LHS, <5,6,7,0>
+  1713410308U, // <0,5,u,7>: Cost 2 vsldoi12 <5,u,7,0>, <5,u,7,0>
+  1713484045U, // <0,5,u,u>: Cost 2 vsldoi12 <5,u,u,0>, <5,u,u,0>
+  2214596949U, // <0,6,0,0>: Cost 3 vmrghw <0,0,0,0>, <6,0,7,0>
+  2214678951U, // <0,6,0,1>: Cost 3 vmrghw <0,0,1,1>, <6,1,7,1>
+  2214597114U, // <0,6,0,2>: Cost 3 vmrghw <0,0,0,0>, <6,2,7,3>
   3852857653U, // <0,6,0,3>: Cost 4 vsldoi12 <4,5,6,0>, <6,0,3,4>
   3832729919U, // <0,6,0,4>: Cost 4 vsldoi12 <1,2,3,0>, <6,0,4,5>
   3721293427U, // <0,6,0,5>: Cost 4 vsldoi4 <5,0,6,0>, <5,0,6,0>
-  3288339256U, // <0,6,0,6>: Cost 3 vmrghw <0,0,0,0>, <6,6,6,6>
-  2281704758U, // <0,6,0,7>: Cost 2 vmrglw <0,0,0,0>, RHS
-  2281704759U, // <0,6,0,u>: Cost 2 vmrglw <0,0,0,0>, RHS
-  3289174305U, // <0,6,1,0>: Cost 3 vmrghw LHS, <6,0,1,2>
-  3289174439U, // <0,6,1,1>: Cost 3 vmrghw LHS, <6,1,7,1>
-  2215432698U, // <0,6,1,2>: Cost 2 vmrghw LHS, <6,2,7,3>
-  3289174578U, // <0,6,1,3>: Cost 3 vmrghw LHS, <6,3,4,5>
-  3289174641U, // <0,6,1,4>: Cost 3 vmrghw LHS, <6,4,2,5>
-  3289174763U, // <0,6,1,5>: Cost 3 vmrghw LHS, <6,5,7,1>
-  2215433016U, // <0,6,1,6>: Cost 2 vmrghw LHS, <6,6,6,6>
-  2295647542U, // <0,6,1,7>: Cost 2 vmrglw <2,3,0,1>, RHS
-  2295647543U, // <0,6,1,u>: Cost 2 vmrglw <2,3,0,1>, RHS
+  2214597432U, // <0,6,0,6>: Cost 3 vmrghw <0,0,0,0>, <6,6,6,6>
+  1207962934U, // <0,6,0,7>: Cost 2 vmrglw <0,0,0,0>, RHS
+  1207962935U, // <0,6,0,u>: Cost 2 vmrglw <0,0,0,0>, RHS
+  2215432481U, // <0,6,1,0>: Cost 3 vmrghw LHS, <6,0,1,2>
+  2215432615U, // <0,6,1,1>: Cost 3 vmrghw LHS, <6,1,7,1>
+  1141690874U, // <0,6,1,2>: Cost 2 vmrghw LHS, <6,2,7,3>
+  2215432754U, // <0,6,1,3>: Cost 3 vmrghw LHS, <6,3,4,5>
+  2215432817U, // <0,6,1,4>: Cost 3 vmrghw LHS, <6,4,2,5>
+  2215432939U, // <0,6,1,5>: Cost 3 vmrghw LHS, <6,5,7,1>
+  1141691192U, // <0,6,1,6>: Cost 2 vmrghw LHS, <6,6,6,6>
+  1221905718U, // <0,6,1,7>: Cost 2 vmrglw <2,3,0,1>, RHS
+  1221905719U, // <0,6,1,u>: Cost 2 vmrglw <2,3,0,1>, RHS
   3852857787U, // <0,6,2,0>: Cost 4 vsldoi12 <4,5,6,0>, <6,2,0,3>
   3289764265U, // <0,6,2,1>: Cost 4 vmrghw <0,2,1,3>, <6,1,7,3>
   3289690618U, // <0,6,2,2>: Cost 4 vmrghw <0,2,0,3>, <6,2,7,3>
@@ -532,8 +532,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3733253430U, // <0,6,2,4>: Cost 4 vsldoi4 <7,0,6,2>, RHS
   3733254242U, // <0,6,2,5>: Cost 4 vsldoi4 <7,0,6,2>, <5,6,7,0>
   3777390522U, // <0,6,2,6>: Cost 4 vsldoi8 <3,2,0,6>, <2,6,3,7>
-  3859567098U, // <0,6,2,7>: Cost 3 vsldoi12 <5,6,7,0>, <6,2,7,3>
-  3859567107U, // <0,6,2,u>: Cost 3 vsldoi12 <5,6,7,0>, <6,2,u,3>
+  2785825274U, // <0,6,2,7>: Cost 3 vsldoi12 <5,6,7,0>, <6,2,7,3>
+  2785825283U, // <0,6,2,u>: Cost 3 vsldoi12 <5,6,7,0>, <6,2,u,3>
   3777390742U, // <0,6,3,0>: Cost 4 vsldoi8 <3,2,0,6>, <3,0,1,2>
   3863106066U, // <0,6,3,1>: Cost 4 vsldoi12 <6,3,1,0>, <6,3,1,0>
   3777390899U, // <0,6,3,2>: Cost 4 vsldoi8 <3,2,0,6>, <3,2,0,6>
@@ -541,17 +541,17 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3779381762U, // <0,6,3,4>: Cost 4 vsldoi8 <3,5,0,6>, <3,4,5,6>
   3779381798U, // <0,6,3,5>: Cost 4 vsldoi8 <3,5,0,6>, <3,5,0,6>
   3733262920U, // <0,6,3,6>: Cost 4 vsldoi4 <7,0,6,3>, <6,3,7,0>
-  3374714166U, // <0,6,3,7>: Cost 3 vmrglw <3,2,0,3>, RHS
-  3374714167U, // <0,6,3,u>: Cost 3 vmrglw <3,2,0,3>, RHS
+  2300972342U, // <0,6,3,7>: Cost 3 vmrglw <3,2,0,3>, RHS
+  2300972343U, // <0,6,3,u>: Cost 3 vmrglw <3,2,0,3>, RHS
   3802606482U, // <0,6,4,0>: Cost 4 vsldoi8 <7,4,0,6>, <4,0,5,1>
-  3291107755U, // <0,6,4,1>: Cost 3 vmrghw <0,4,1,5>, <6,1,7,5>
-  3291107834U, // <0,6,4,2>: Cost 3 vmrghw <0,4,1,5>, <6,2,7,3>
+  2217365931U, // <0,6,4,1>: Cost 3 vmrghw <0,4,1,5>, <6,1,7,5>
+  2217366010U, // <0,6,4,2>: Cost 3 vmrghw <0,4,1,5>, <6,2,7,3>
   3291107890U, // <0,6,4,3>: Cost 4 vmrghw <0,4,1,5>, <6,3,4,5>
   3291099805U, // <0,6,4,4>: Cost 4 vmrghw <0,4,1,4>, <6,4,7,4>
   3777391926U, // <0,6,4,5>: Cost 4 vsldoi8 <3,2,0,6>, RHS
-  3291108152U, // <0,6,4,6>: Cost 3 vmrghw <0,4,1,5>, <6,6,6,6>
-  3364769078U, // <0,6,4,7>: Cost 3 vmrglw <1,5,0,4>, RHS
-  3364769079U, // <0,6,4,u>: Cost 3 vmrglw <1,5,0,4>, RHS
+  2217366328U, // <0,6,4,6>: Cost 3 vmrghw <0,4,1,5>, <6,6,6,6>
+  2291027254U, // <0,6,4,7>: Cost 3 vmrglw <1,5,0,4>, RHS
+  2291027255U, // <0,6,4,u>: Cost 3 vmrglw <1,5,0,4>, RHS
   3852858033U, // <0,6,5,0>: Cost 4 vsldoi12 <4,5,6,0>, <6,5,0,6>
   3395964532U, // <0,6,5,1>: Cost 4 vmrglw <6,7,0,5>, <5,0,6,1>
   3864507069U, // <0,6,5,2>: Cost 4 vsldoi12 <6,5,2,0>, <6,5,2,0>
@@ -559,504 +559,504 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3721334070U, // <0,6,5,4>: Cost 4 vsldoi4 <5,0,6,5>, RHS
   3395964860U, // <0,6,5,5>: Cost 4 vmrglw <6,7,0,5>, <5,4,6,5>
   3864802017U, // <0,6,5,6>: Cost 4 vsldoi12 <6,5,6,0>, <6,5,6,0>
-  3376057654U, // <0,6,5,7>: Cost 3 vmrglw <3,4,0,5>, RHS
-  3376057655U, // <0,6,5,u>: Cost 3 vmrglw <3,4,0,5>, RHS
+  2302315830U, // <0,6,5,7>: Cost 3 vmrglw <3,4,0,5>, RHS
+  2302315831U, // <0,6,5,u>: Cost 3 vmrglw <3,4,0,5>, RHS
   3852858108U, // <0,6,6,0>: Cost 4 vsldoi12 <4,5,6,0>, <6,6,0,0>
   3398624745U, // <0,6,6,1>: Cost 4 vmrglw <7,2,0,6>, <2,0,6,1>
-  3292410362U, // <0,6,6,2>: Cost 3 vmrghw <0,6,1,2>, <6,2,7,3>
+  2218668538U, // <0,6,6,2>: Cost 3 vmrghw <0,6,1,2>, <6,2,7,3>
   3292418610U, // <0,6,6,3>: Cost 4 vmrghw <0,6,1,3>, <6,3,4,5>
   3733286198U, // <0,6,6,4>: Cost 4 vsldoi4 <7,0,6,6>, RHS
   3797299889U, // <0,6,6,5>: Cost 4 vsldoi8 <6,5,0,6>, <6,5,0,6>
-  3859567416U, // <0,6,6,6>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,6,6>
-  3859567426U, // <0,6,6,7>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,7,7>
-  3859567435U, // <0,6,6,u>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,u,7>
-  3859567438U, // <0,6,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,0,1>
-  3832730456U, // <0,6,7,1>: Cost 3 vsldoi12 <1,2,3,0>, <6,7,1,2>
+  2785825592U, // <0,6,6,6>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,6,6>
+  2785825602U, // <0,6,6,7>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,7,7>
+  2785825611U, // <0,6,6,u>: Cost 3 vsldoi12 <5,6,7,0>, <6,6,u,7>
+  2785825614U, // <0,6,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,0,1>
+  2758988632U, // <0,6,7,1>: Cost 3 vsldoi12 <1,2,3,0>, <6,7,1,2>
   3377400084U, // <0,6,7,2>: Cost 4 vmrglw <3,6,0,7>, <3,1,6,2>
-  3865908072U, // <0,6,7,3>: Cost 3 vsldoi12 <6,7,3,0>, <6,7,3,0>
-  3859567478U, // <0,6,7,4>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,4,5>
-  3859567488U, // <0,6,7,5>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,5,6>
+  2792166248U, // <0,6,7,3>: Cost 3 vsldoi12 <6,7,3,0>, <6,7,3,0>
+  2785825654U, // <0,6,7,4>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,4,5>
+  2785825664U, // <0,6,7,5>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,5,6>
   3859567493U, // <0,6,7,6>: Cost 4 vsldoi12 <5,6,7,0>, <6,7,6,2>
-  3377401142U, // <0,6,7,7>: Cost 3 vmrglw <3,6,0,7>, RHS
-  3377401143U, // <0,6,7,u>: Cost 3 vmrglw <3,6,0,7>, RHS
-  3859567519U, // <0,6,u,0>: Cost 3 vsldoi12 <5,6,7,0>, <6,u,0,1>
-  3293819303U, // <0,6,u,1>: Cost 3 vmrghw LHS, <6,1,7,1>
-  2220077562U, // <0,6,u,2>: Cost 2 vmrghw LHS, <6,2,7,3>
-  3866571705U, // <0,6,u,3>: Cost 3 vsldoi12 <6,u,3,0>, <6,u,3,0>
-  3859567559U, // <0,6,u,4>: Cost 3 vsldoi12 <5,6,7,0>, <6,u,4,5>
-  3859567488U, // <0,6,u,5>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,5,6>
-  2220077880U, // <0,6,u,6>: Cost 2 vmrghw LHS, <6,6,6,6>
-  2295704886U, // <0,6,u,7>: Cost 2 vmrglw <2,3,0,u>, RHS
-  2295704887U, // <0,6,u,u>: Cost 2 vmrglw <2,3,0,u>, RHS
-  3727335424U, // <0,7,0,0>: Cost 3 vsldoi4 <6,0,7,0>, <0,0,0,0>
-  3780051046U, // <0,7,0,1>: Cost 3 vsldoi8 <3,6,0,7>, LHS
+  2303659318U, // <0,6,7,7>: Cost 3 vmrglw <3,6,0,7>, RHS
+  2303659319U, // <0,6,7,u>: Cost 3 vmrglw <3,6,0,7>, RHS
+  2785825695U, // <0,6,u,0>: Cost 3 vsldoi12 <5,6,7,0>, <6,u,0,1>
+  2220077479U, // <0,6,u,1>: Cost 3 vmrghw LHS, <6,1,7,1>
+  1146335738U, // <0,6,u,2>: Cost 2 vmrghw LHS, <6,2,7,3>
+  2792829881U, // <0,6,u,3>: Cost 3 vsldoi12 <6,u,3,0>, <6,u,3,0>
+  2785825735U, // <0,6,u,4>: Cost 3 vsldoi12 <5,6,7,0>, <6,u,4,5>
+  2785825664U, // <0,6,u,5>: Cost 3 vsldoi12 <5,6,7,0>, <6,7,5,6>
+  1146336056U, // <0,6,u,6>: Cost 2 vmrghw LHS, <6,6,6,6>
+  1221963062U, // <0,6,u,7>: Cost 2 vmrglw <2,3,0,u>, RHS
+  1221963063U, // <0,6,u,u>: Cost 2 vmrglw <2,3,0,u>, RHS
+  2653593600U, // <0,7,0,0>: Cost 3 vsldoi4 <6,0,7,0>, <0,0,0,0>
+  2706309222U, // <0,7,0,1>: Cost 3 vsldoi8 <3,6,0,7>, LHS
   3709421498U, // <0,7,0,2>: Cost 4 vsldoi4 <3,0,7,0>, <2,6,3,7>
-  3355447802U, // <0,7,0,3>: Cost 3 vmrglw <0,0,0,0>, <6,2,7,3>
-  3859567640U, // <0,7,0,4>: Cost 3 vsldoi12 <5,6,7,0>, <7,0,4,5>
-  3859567650U, // <0,7,0,5>: Cost 3 vsldoi12 <5,6,7,0>, <7,0,5,6>
-  3727339861U, // <0,7,0,6>: Cost 3 vsldoi4 <6,0,7,0>, <6,0,7,0>
-  3288340076U, // <0,7,0,7>: Cost 3 vmrghw <0,0,0,0>, <7,7,7,7>
-  3780051613U, // <0,7,0,u>: Cost 3 vsldoi8 <3,6,0,7>, LHS
-  2215433210U, // <0,7,1,0>: Cost 2 vmrghw LHS, <7,0,1,2>
-  3289175114U, // <0,7,1,1>: Cost 3 vmrghw LHS, <7,1,1,1>
-  3780051862U, // <0,7,1,2>: Cost 3 vsldoi8 <3,6,0,7>, <1,2,3,0>
-  3395932666U, // <0,7,1,3>: Cost 3 vmrglw <6,7,0,1>, <6,2,7,3>
-  2215433574U, // <0,7,1,4>: Cost 2 vmrghw LHS, <7,4,5,6>
-  3289175478U, // <0,7,1,5>: Cost 3 vmrghw LHS, <7,5,5,5>
-  3727348054U, // <0,7,1,6>: Cost 3 vsldoi4 <6,0,7,1>, <6,0,7,1>
-  2215433836U, // <0,7,1,7>: Cost 2 vmrghw LHS, <7,7,7,7>
-  2215433858U, // <0,7,1,u>: Cost 2 vmrghw LHS, <7,u,1,2>
-  3859567764U, // <0,7,2,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,2,0,3>
+  2281705978U, // <0,7,0,3>: Cost 3 vmrglw <0,0,0,0>, <6,2,7,3>
+  2785825816U, // <0,7,0,4>: Cost 3 vsldoi12 <5,6,7,0>, <7,0,4,5>
+  2785825826U, // <0,7,0,5>: Cost 3 vsldoi12 <5,6,7,0>, <7,0,5,6>
+  2653598037U, // <0,7,0,6>: Cost 3 vsldoi4 <6,0,7,0>, <6,0,7,0>
+  2214598252U, // <0,7,0,7>: Cost 3 vmrghw <0,0,0,0>, <7,7,7,7>
+  2706309789U, // <0,7,0,u>: Cost 3 vsldoi8 <3,6,0,7>, LHS
+  1141691386U, // <0,7,1,0>: Cost 2 vmrghw LHS, <7,0,1,2>
+  2215433290U, // <0,7,1,1>: Cost 3 vmrghw LHS, <7,1,1,1>
+  2706310038U, // <0,7,1,2>: Cost 3 vsldoi8 <3,6,0,7>, <1,2,3,0>
+  2322190842U, // <0,7,1,3>: Cost 3 vmrglw <6,7,0,1>, <6,2,7,3>
+  1141691750U, // <0,7,1,4>: Cost 2 vmrghw LHS, <7,4,5,6>
+  2215433654U, // <0,7,1,5>: Cost 3 vmrghw LHS, <7,5,5,5>
+  2653606230U, // <0,7,1,6>: Cost 3 vsldoi4 <6,0,7,1>, <6,0,7,1>
+  1141692012U, // <0,7,1,7>: Cost 2 vmrghw LHS, <7,7,7,7>
+  1141692034U, // <0,7,1,u>: Cost 2 vmrghw LHS, <7,u,1,2>
+  2785825940U, // <0,7,2,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,2,0,3>
   3768108576U, // <0,7,2,1>: Cost 5 vsldoi8 <1,6,0,7>, <2,1,3,2>
   3780052584U, // <0,7,2,2>: Cost 4 vsldoi8 <3,6,0,7>, <2,2,2,2>
-  3868562604U, // <0,7,2,3>: Cost 3 vsldoi12 <7,2,3,0>, <7,2,3,0>
+  2794820780U, // <0,7,2,3>: Cost 3 vsldoi12 <7,2,3,0>, <7,2,3,0>
   3859641528U, // <0,7,2,4>: Cost 4 vsldoi12 <5,6,u,0>, <7,2,4,3>
   3733327970U, // <0,7,2,5>: Cost 4 vsldoi4 <7,0,7,2>, <5,6,7,0>
   3778062266U, // <0,7,2,6>: Cost 4 vsldoi8 <3,3,0,7>, <2,6,3,7>
   3733328944U, // <0,7,2,7>: Cost 4 vsldoi4 <7,0,7,2>, <7,0,7,2>
-  3868931289U, // <0,7,2,u>: Cost 3 vsldoi12 <7,2,u,0>, <7,2,u,0>
-  3398602850U, // <0,7,3,0>: Cost 3 vmrglw <7,2,0,3>, <5,6,7,0>
+  2795189465U, // <0,7,2,u>: Cost 3 vsldoi12 <7,2,u,0>, <7,2,u,0>
+  2324861026U, // <0,7,3,0>: Cost 3 vmrglw <7,2,0,3>, <5,6,7,0>
   3780053233U, // <0,7,3,1>: Cost 4 vsldoi8 <3,6,0,7>, <3,1,2,3>
   3780053296U, // <0,7,3,2>: Cost 4 vsldoi8 <3,6,0,7>, <3,2,0,3>
   3778062725U, // <0,7,3,3>: Cost 4 vsldoi8 <3,3,0,7>, <3,3,0,7>
   3780053506U, // <0,7,3,4>: Cost 4 vsldoi8 <3,6,0,7>, <3,4,5,6>
   3803941469U, // <0,7,3,5>: Cost 4 vsldoi8 <7,6,0,7>, <3,5,6,7>
-  3780053624U, // <0,7,3,6>: Cost 3 vsldoi8 <3,6,0,7>, <3,6,0,7>
+  2706311800U, // <0,7,3,6>: Cost 3 vsldoi8 <3,6,0,7>, <3,6,0,7>
   3398603586U, // <0,7,3,7>: Cost 4 vmrglw <7,2,0,3>, <6,6,7,7>
-  3781380890U, // <0,7,3,u>: Cost 3 vsldoi8 <3,u,0,7>, <3,u,0,7>
-  3291108346U, // <0,7,4,0>: Cost 3 vmrghw <0,4,1,5>, <7,0,1,2>
+  2707639066U, // <0,7,3,u>: Cost 3 vsldoi8 <3,u,0,7>, <3,u,0,7>
+  2217366522U, // <0,7,4,0>: Cost 3 vmrghw <0,4,1,5>, <7,0,1,2>
   3727369110U, // <0,7,4,1>: Cost 4 vsldoi4 <6,0,7,4>, <1,2,3,0>
   3291108500U, // <0,7,4,2>: Cost 4 vmrghw <0,4,1,5>, <7,2,0,3>
   3727370872U, // <0,7,4,3>: Cost 4 vsldoi4 <6,0,7,4>, <3,6,0,7>
-  3291108710U, // <0,7,4,4>: Cost 3 vmrghw <0,4,1,5>, <7,4,5,6>
-  3780054326U, // <0,7,4,5>: Cost 3 vsldoi8 <3,6,0,7>, RHS
+  2217366886U, // <0,7,4,4>: Cost 3 vmrghw <0,4,1,5>, <7,4,5,6>
+  2706312502U, // <0,7,4,5>: Cost 3 vsldoi8 <3,6,0,7>, RHS
   3786026321U, // <0,7,4,6>: Cost 4 vsldoi8 <4,6,0,7>, <4,6,0,7>
-  3291108972U, // <0,7,4,7>: Cost 3 vmrghw <0,4,1,5>, <7,7,7,7>
-  3780054569U, // <0,7,4,u>: Cost 3 vsldoi8 <3,6,0,7>, RHS
-  3395965026U, // <0,7,5,0>: Cost 3 vmrglw <6,7,0,5>, <5,6,7,0>
+  2217367148U, // <0,7,4,7>: Cost 3 vmrghw <0,4,1,5>, <7,7,7,7>
+  2706312745U, // <0,7,4,u>: Cost 3 vsldoi8 <3,6,0,7>, RHS
+  2322223202U, // <0,7,5,0>: Cost 3 vmrglw <6,7,0,5>, <5,6,7,0>
   3399946987U, // <0,7,5,1>: Cost 4 vmrglw <7,4,0,5>, <6,5,7,1>
   3291780244U, // <0,7,5,2>: Cost 4 vmrghw <0,5,1,6>, <7,2,0,3>
   3727378582U, // <0,7,5,3>: Cost 4 vsldoi4 <6,0,7,5>, <3,0,1,2>
   3727379766U, // <0,7,5,4>: Cost 4 vsldoi4 <6,0,7,5>, RHS
   3859568054U, // <0,7,5,5>: Cost 4 vsldoi12 <5,6,7,0>, <7,5,5,5>
-  3859568065U, // <0,7,5,6>: Cost 3 vsldoi12 <5,6,7,0>, <7,5,6,7>
+  2785826241U, // <0,7,5,6>: Cost 3 vsldoi12 <5,6,7,0>, <7,5,6,7>
   3395965762U, // <0,7,5,7>: Cost 4 vmrglw <6,7,0,5>, <6,6,7,7>
-  3860895187U, // <0,7,5,u>: Cost 3 vsldoi12 <5,u,7,0>, <7,5,u,7>
-  3859568092U, // <0,7,6,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,6,0,7>
+  2787153363U, // <0,7,5,u>: Cost 3 vsldoi12 <5,u,7,0>, <7,5,u,7>
+  2785826268U, // <0,7,6,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,6,0,7>
   3780055420U, // <0,7,6,1>: Cost 5 vsldoi8 <3,6,0,7>, <6,1,2,3>
   3859568110U, // <0,7,6,2>: Cost 4 vsldoi12 <5,6,7,0>, <7,6,2,7>
   3874534903U, // <0,7,6,3>: Cost 4 vsldoi12 <u,2,3,0>, <7,6,3,7>
   3859641856U, // <0,7,6,4>: Cost 4 vsldoi12 <5,6,u,0>, <7,6,4,7>
   3733360738U, // <0,7,6,5>: Cost 4 vsldoi4 <7,0,7,6>, <5,6,7,0>
   3859568145U, // <0,7,6,6>: Cost 4 vsldoi12 <5,6,7,0>, <7,6,6,6>
-  3871512084U, // <0,7,6,7>: Cost 3 vsldoi12 <7,6,7,0>, <7,6,7,0>
-  3871585821U, // <0,7,6,u>: Cost 3 vsldoi12 <7,6,u,0>, <7,6,u,0>
-  3859568166U, // <0,7,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,7,0,0>
+  2797770260U, // <0,7,6,7>: Cost 3 vsldoi12 <7,6,7,0>, <7,6,7,0>
+  2797843997U, // <0,7,6,u>: Cost 3 vsldoi12 <7,6,u,0>, <7,6,u,0>
+  2785826342U, // <0,7,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <7,7,0,0>
   3727393686U, // <0,7,7,1>: Cost 4 vsldoi4 <6,0,7,7>, <1,2,3,0>
   3868563003U, // <0,7,7,2>: Cost 4 vsldoi12 <7,2,3,0>, <7,7,2,3>
   3377397988U, // <0,7,7,3>: Cost 4 vmrglw <3,6,0,7>, <0,2,7,3>
-  3293091174U, // <0,7,7,4>: Cost 3 vmrghw <0,7,1,4>, <7,4,5,6>
+  2219349350U, // <0,7,7,4>: Cost 3 vmrghw <0,7,1,4>, <7,4,5,6>
   3859568217U, // <0,7,7,5>: Cost 4 vsldoi12 <5,6,7,0>, <7,7,5,6>
-  3803944412U, // <0,7,7,6>: Cost 3 vsldoi8 <7,6,0,7>, <7,6,0,7>
-  3859568236U, // <0,7,7,7>: Cost 3 vsldoi12 <5,6,7,0>, <7,7,7,7>
-  3805271678U, // <0,7,7,u>: Cost 3 vsldoi8 <7,u,0,7>, <7,u,0,7>
-  2220078074U, // <0,7,u,0>: Cost 2 vmrghw LHS, <7,0,1,2>
-  3780056878U, // <0,7,u,1>: Cost 3 vsldoi8 <3,6,0,7>, LHS
-  3727402669U, // <0,7,u,2>: Cost 3 vsldoi4 <6,0,7,u>, <2,3,0,u>
-  3395990010U, // <0,7,u,3>: Cost 3 vmrglw <6,7,0,u>, <6,2,7,3>
-  2220078438U, // <0,7,u,4>: Cost 2 vmrghw LHS, <7,4,5,6>
-  3780057242U, // <0,7,u,5>: Cost 3 vsldoi8 <3,6,0,7>, RHS
-  3727405405U, // <0,7,u,6>: Cost 3 vsldoi4 <6,0,7,u>, <6,0,7,u>
-  2220078700U, // <0,7,u,7>: Cost 2 vmrghw LHS, <7,7,7,7>
-  2220078722U, // <0,7,u,u>: Cost 2 vmrghw LHS, <7,u,1,2>
-  1275904102U, // <0,u,0,0>: Cost 1 vspltisw0 LHS
-  2698354790U, // <0,u,0,1>: Cost 2 vsldoi8 <2,3,0,u>, LHS
-  3703522810U, // <0,u,0,2>: Cost 3 vsldoi4 <2,0,u,0>, <2,0,u,0>
-  2281701532U, // <0,u,0,3>: Cost 2 vmrglw <0,0,0,0>, LHS
-  2617838902U, // <0,u,0,4>: Cost 2 vsldoi4 <0,0,u,0>, RHS
-  2214598810U, // <0,u,0,5>: Cost 2 vmrghw <0,0,0,0>, RHS
-  3772097077U, // <0,u,0,6>: Cost 3 vsldoi8 <2,3,0,u>, <0,6,u,7>
-  2281704776U, // <0,u,0,7>: Cost 2 vmrglw <0,0,0,0>, RHS
-  1275904102U, // <0,u,0,u>: Cost 1 vspltisw0 LHS
-  2215876307U, // <0,u,1,0>: Cost 2 vmrghw LHS, <u,0,1,2>
-  1141692206U, // <0,u,1,1>: Cost 1 vmrghw LHS, LHS
-  2215917448U, // <0,u,1,2>: Cost 2 vmrghw LHS, <u,2,3,3>
-  2215917500U, // <0,u,1,3>: Cost 2 vmrghw LHS, <u,3,0,1>
-  2215876671U, // <0,u,1,4>: Cost 2 vmrghw LHS, <u,4,5,6>
-  1141692570U, // <0,u,1,5>: Cost 1 vmrghw LHS, RHS
-  2215917776U, // <0,u,1,6>: Cost 2 vmrghw LHS, <u,6,3,7>
-  2295647560U, // <0,u,1,7>: Cost 2 vmrglw <2,3,0,1>, RHS
-  1141692773U, // <0,u,1,u>: Cost 1 vmrghw LHS, LHS
-  2635767910U, // <0,u,2,0>: Cost 2 vsldoi4 <3,0,u,2>, LHS
-  3289757486U, // <0,u,2,1>: Cost 3 vmrghw <0,2,1,2>, LHS
-  3772098152U, // <0,u,2,2>: Cost 3 vsldoi8 <2,3,0,u>, <2,2,2,2>
+  2730202588U, // <0,7,7,6>: Cost 3 vsldoi8 <7,6,0,7>, <7,6,0,7>
+  2785826412U, // <0,7,7,7>: Cost 3 vsldoi12 <5,6,7,0>, <7,7,7,7>
+  2731529854U, // <0,7,7,u>: Cost 3 vsldoi8 <7,u,0,7>, <7,u,0,7>
+  1146336250U, // <0,7,u,0>: Cost 2 vmrghw LHS, <7,0,1,2>
+  2706315054U, // <0,7,u,1>: Cost 3 vsldoi8 <3,6,0,7>, LHS
+  2653660845U, // <0,7,u,2>: Cost 3 vsldoi4 <6,0,7,u>, <2,3,0,u>
+  2322248186U, // <0,7,u,3>: Cost 3 vmrglw <6,7,0,u>, <6,2,7,3>
+  1146336614U, // <0,7,u,4>: Cost 2 vmrghw LHS, <7,4,5,6>
+  2706315418U, // <0,7,u,5>: Cost 3 vsldoi8 <3,6,0,7>, RHS
+  2653663581U, // <0,7,u,6>: Cost 3 vsldoi4 <6,0,7,u>, <6,0,7,u>
+  1146336876U, // <0,7,u,7>: Cost 2 vmrghw LHS, <7,7,7,7>
+  1146336898U, // <0,7,u,u>: Cost 2 vmrghw LHS, <7,u,1,2>
+  202162278U,  // <0,u,0,0>: Cost 1 vspltisw0 LHS
+  1624612966U, // <0,u,0,1>: Cost 2 vsldoi8 <2,3,0,u>, LHS
+  2629780986U, // <0,u,0,2>: Cost 3 vsldoi4 <2,0,u,0>, <2,0,u,0>
+  1207959708U, // <0,u,0,3>: Cost 2 vmrglw <0,0,0,0>, LHS
+  1544097078U, // <0,u,0,4>: Cost 2 vsldoi4 <0,0,u,0>, RHS
+  1140856986U, // <0,u,0,5>: Cost 2 vmrghw <0,0,0,0>, RHS
+  2698355253U, // <0,u,0,6>: Cost 3 vsldoi8 <2,3,0,u>, <0,6,u,7>
+  1207962952U, // <0,u,0,7>: Cost 2 vmrglw <0,0,0,0>, RHS
+  202162278U,  // <0,u,0,u>: Cost 1 vspltisw0 LHS
+  1142134483U, // <0,u,1,0>: Cost 2 vmrghw LHS, <u,0,1,2>
+  67950382U,   // <0,u,1,1>: Cost 1 vmrghw LHS, LHS
+  1142175624U, // <0,u,1,2>: Cost 2 vmrghw LHS, <u,2,3,3>
+  1142175676U, // <0,u,1,3>: Cost 2 vmrghw LHS, <u,3,0,1>
+  1142134847U, // <0,u,1,4>: Cost 2 vmrghw LHS, <u,4,5,6>
+  67950746U,   // <0,u,1,5>: Cost 1 vmrghw LHS, RHS
+  1142175952U, // <0,u,1,6>: Cost 2 vmrghw LHS, <u,6,3,7>
+  1221905736U, // <0,u,1,7>: Cost 2 vmrglw <2,3,0,1>, RHS
+  67950949U,   // <0,u,1,u>: Cost 1 vmrghw LHS, LHS
+  1562026086U, // <0,u,2,0>: Cost 2 vsldoi4 <3,0,u,2>, LHS
+  2216015662U, // <0,u,2,1>: Cost 3 vmrghw <0,2,1,2>, LHS
+  2698356328U, // <0,u,2,2>: Cost 3 vsldoi8 <2,3,0,u>, <2,2,2,2>
   835584U,     // <0,u,2,3>: Cost 0 copy LHS
-  2635771190U, // <0,u,2,4>: Cost 2 vsldoi4 <3,0,u,2>, RHS
-  3289757850U, // <0,u,2,5>: Cost 3 vmrghw <0,2,1,2>, RHS
-  3772098490U, // <0,u,2,6>: Cost 3 vsldoi8 <2,3,0,u>, <2,6,3,7>
-  2659660857U, // <0,u,2,7>: Cost 2 vsldoi4 <7,0,u,2>, <7,0,u,2>
+  1562029366U, // <0,u,2,4>: Cost 2 vsldoi4 <3,0,u,2>, RHS
+  2216016026U, // <0,u,2,5>: Cost 3 vmrghw <0,2,1,2>, RHS
+  2698356666U, // <0,u,2,6>: Cost 3 vsldoi8 <2,3,0,u>, <2,6,3,7>
+  1585919033U, // <0,u,2,7>: Cost 2 vsldoi4 <7,0,u,2>, <7,0,u,2>
   835584U,     // <0,u,2,u>: Cost 0 copy LHS
-  3832731580U, // <0,u,3,0>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,0,1>
-  3290404654U, // <0,u,3,1>: Cost 3 vmrghw <0,3,1,0>, LHS
-  3777407285U, // <0,u,3,2>: Cost 3 vsldoi8 <3,2,0,u>, <3,2,0,u>
-  3832731606U, // <0,u,3,3>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,3,0>
-  3832731620U, // <0,u,3,4>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,4,5>
-  3290405018U, // <0,u,3,5>: Cost 3 vmrghw <0,3,1,0>, RHS
-  3780061817U, // <0,u,3,6>: Cost 3 vsldoi8 <3,6,0,u>, <3,6,0,u>
-  3374714184U, // <0,u,3,7>: Cost 3 vmrglw <3,2,0,3>, RHS
-  3290405221U, // <0,u,3,u>: Cost 3 vmrghw <0,3,1,0>, LHS
-  3291109075U, // <0,u,4,0>: Cost 3 vmrghw <0,4,1,5>, <u,0,1,2>
-  2217367342U, // <0,u,4,1>: Cost 2 vmrghw <0,4,1,5>, LHS
-  3291109256U, // <0,u,4,2>: Cost 3 vmrghw <0,4,1,5>, <u,2,3,3>
-  3291109308U, // <0,u,4,3>: Cost 3 vmrghw <0,4,1,5>, <u,3,0,1>
-  2217361746U, // <0,u,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
-  2217367706U, // <0,u,4,5>: Cost 2 vmrghw <0,4,1,5>, RHS
-  3291109584U, // <0,u,4,6>: Cost 3 vmrghw <0,4,1,5>, <u,6,3,7>
-  3364769096U, // <0,u,4,7>: Cost 3 vmrglw <1,5,0,4>, RHS
-  2217367909U, // <0,u,4,u>: Cost 2 vmrghw <0,4,1,5>, LHS
-  3709534310U, // <0,u,5,0>: Cost 3 vsldoi4 <3,0,u,5>, LHS
-  3709535126U, // <0,u,5,1>: Cost 3 vsldoi4 <3,0,u,5>, <1,2,3,0>
-  3376056470U, // <0,u,5,2>: Cost 3 vmrglw <3,4,0,5>, <3,0,1,2>
-  3709536472U, // <0,u,5,3>: Cost 3 vsldoi4 <3,0,u,5>, <3,0,u,5>
-  3709537590U, // <0,u,5,4>: Cost 3 vsldoi4 <3,0,u,5>, RHS
-  3791343578U, // <0,u,5,5>: Cost 3 vsldoi8 <5,5,0,u>, <5,5,0,u>
-  2758989978U, // <0,u,5,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
-  3376057672U, // <0,u,5,7>: Cost 3 vmrglw <3,4,0,5>, RHS
-  2758989996U, // <0,u,5,u>: Cost 2 vsldoi12 <1,2,3,0>, RHS
-  3833100469U, // <0,u,6,0>: Cost 3 vsldoi12 <1,2,u,0>, <u,6,0,7>
-  3292378926U, // <0,u,6,1>: Cost 3 vmrghw <0,6,0,7>, LHS
-  3798643194U, // <0,u,6,2>: Cost 3 vsldoi8 <6,7,0,u>, <6,2,7,3>
-  3832731856U, // <0,u,6,3>: Cost 3 vsldoi12 <1,2,3,0>, <u,6,3,7>
-  3733433654U, // <0,u,6,4>: Cost 3 vsldoi4 <7,0,u,6>, RHS
-  3733213282U, // <0,u,6,5>: Cost 3 vsldoi4 <7,0,5,6>, <5,6,7,0>
-  3798643512U, // <0,u,6,6>: Cost 3 vsldoi8 <6,7,0,u>, <6,6,6,6>
-  2724901717U, // <0,u,6,7>: Cost 2 vsldoi8 <6,7,0,u>, <6,7,0,u>
-  2725565350U, // <0,u,6,u>: Cost 2 vsldoi8 <6,u,0,u>, <6,u,0,u>
-  3859568896U, // <0,u,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,0,1>
-  3877705992U, // <0,u,7,1>: Cost 3 vsldoi12 <u,7,1,0>, <u,7,1,0>
-  3801298073U, // <0,u,7,2>: Cost 3 vsldoi8 <7,2,0,u>, <7,2,0,u>
-  3377397916U, // <0,u,7,3>: Cost 3 vmrglw <3,6,0,7>, LHS
-  3859568936U, // <0,u,7,4>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,4,5>
-  3859568946U, // <0,u,7,5>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,5,6>
-  3803952605U, // <0,u,7,6>: Cost 3 vsldoi8 <7,6,0,u>, <7,6,0,u>
-  3377401160U, // <0,u,7,7>: Cost 3 vmrglw <3,6,0,7>, RHS
-  3377397921U, // <0,u,7,u>: Cost 3 vmrglw <3,6,0,7>, LHS
-  1275904102U, // <0,u,u,0>: Cost 1 vspltisw0 LHS
-  1146337070U, // <0,u,u,1>: Cost 1 vmrghw LHS, LHS
-  2220078984U, // <0,u,u,2>: Cost 2 vmrghw LHS, <u,2,3,3>
+  2758989756U, // <0,u,3,0>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,0,1>
+  2216662830U, // <0,u,3,1>: Cost 3 vmrghw <0,3,1,0>, LHS
+  2703665461U, // <0,u,3,2>: Cost 3 vsldoi8 <3,2,0,u>, <3,2,0,u>
+  2758989782U, // <0,u,3,3>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,3,0>
+  2758989796U, // <0,u,3,4>: Cost 3 vsldoi12 <1,2,3,0>, <u,3,4,5>
+  2216663194U, // <0,u,3,5>: Cost 3 vmrghw <0,3,1,0>, RHS
+  2706319993U, // <0,u,3,6>: Cost 3 vsldoi8 <3,6,0,u>, <3,6,0,u>
+  2300972360U, // <0,u,3,7>: Cost 3 vmrglw <3,2,0,3>, RHS
+  2216663397U, // <0,u,3,u>: Cost 3 vmrghw <0,3,1,0>, LHS
+  2217367251U, // <0,u,4,0>: Cost 3 vmrghw <0,4,1,5>, <u,0,1,2>
+  1143625518U, // <0,u,4,1>: Cost 2 vmrghw <0,4,1,5>, LHS
+  2217367432U, // <0,u,4,2>: Cost 3 vmrghw <0,4,1,5>, <u,2,3,3>
+  2217367484U, // <0,u,4,3>: Cost 3 vmrghw <0,4,1,5>, <u,3,0,1>
+  1143619922U, // <0,u,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
+  1143625882U, // <0,u,4,5>: Cost 2 vmrghw <0,4,1,5>, RHS
+  2217367760U, // <0,u,4,6>: Cost 3 vmrghw <0,4,1,5>, <u,6,3,7>
+  2291027272U, // <0,u,4,7>: Cost 3 vmrglw <1,5,0,4>, RHS
+  1143626085U, // <0,u,4,u>: Cost 2 vmrghw <0,4,1,5>, LHS
+  2635792486U, // <0,u,5,0>: Cost 3 vsldoi4 <3,0,u,5>, LHS
+  2635793302U, // <0,u,5,1>: Cost 3 vsldoi4 <3,0,u,5>, <1,2,3,0>
+  2302314646U, // <0,u,5,2>: Cost 3 vmrglw <3,4,0,5>, <3,0,1,2>
+  2635794648U, // <0,u,5,3>: Cost 3 vsldoi4 <3,0,u,5>, <3,0,u,5>
+  2635795766U, // <0,u,5,4>: Cost 3 vsldoi4 <3,0,u,5>, RHS
+  2717601754U, // <0,u,5,5>: Cost 3 vsldoi8 <5,5,0,u>, <5,5,0,u>
+  1685248154U, // <0,u,5,6>: Cost 2 vsldoi12 <1,2,3,0>, RHS
+  2302315848U, // <0,u,5,7>: Cost 3 vmrglw <3,4,0,5>, RHS
+  1685248172U, // <0,u,5,u>: Cost 2 vsldoi12 <1,2,3,0>, RHS
+  2759358645U, // <0,u,6,0>: Cost 3 vsldoi12 <1,2,u,0>, <u,6,0,7>
+  2218637102U, // <0,u,6,1>: Cost 3 vmrghw <0,6,0,7>, LHS
+  2724901370U, // <0,u,6,2>: Cost 3 vsldoi8 <6,7,0,u>, <6,2,7,3>
+  2758990032U, // <0,u,6,3>: Cost 3 vsldoi12 <1,2,3,0>, <u,6,3,7>
+  2659691830U, // <0,u,6,4>: Cost 3 vsldoi4 <7,0,u,6>, RHS
+  2659471458U, // <0,u,6,5>: Cost 3 vsldoi4 <7,0,5,6>, <5,6,7,0>
+  2724901688U, // <0,u,6,6>: Cost 3 vsldoi8 <6,7,0,u>, <6,6,6,6>
+  1651159893U, // <0,u,6,7>: Cost 2 vsldoi8 <6,7,0,u>, <6,7,0,u>
+  1651823526U, // <0,u,6,u>: Cost 2 vsldoi8 <6,u,0,u>, <6,u,0,u>
+  2785827072U, // <0,u,7,0>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,0,1>
+  2803964168U, // <0,u,7,1>: Cost 3 vsldoi12 <u,7,1,0>, <u,7,1,0>
+  2727556249U, // <0,u,7,2>: Cost 3 vsldoi8 <7,2,0,u>, <7,2,0,u>
+  2303656092U, // <0,u,7,3>: Cost 3 vmrglw <3,6,0,7>, LHS
+  2785827112U, // <0,u,7,4>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,4,5>
+  2785827122U, // <0,u,7,5>: Cost 3 vsldoi12 <5,6,7,0>, <u,7,5,6>
+  2730210781U, // <0,u,7,6>: Cost 3 vsldoi8 <7,6,0,u>, <7,6,0,u>
+  2303659336U, // <0,u,7,7>: Cost 3 vmrglw <3,6,0,7>, RHS
+  2303656097U, // <0,u,7,u>: Cost 3 vmrglw <3,6,0,7>, LHS
+  202162278U,  // <0,u,u,0>: Cost 1 vspltisw0 LHS
+  72595246U,   // <0,u,u,1>: Cost 1 vmrghw LHS, LHS
+  1146337160U, // <0,u,u,2>: Cost 2 vmrghw LHS, <u,2,3,3>
   835584U,     // <0,u,u,3>: Cost 0 copy LHS
-  2220079167U, // <0,u,u,4>: Cost 2 vmrghw LHS, <u,4,5,6>
-  1146337434U, // <0,u,u,5>: Cost 1 vmrghw LHS, RHS
-  2220079312U, // <0,u,u,6>: Cost 2 vmrghw LHS, <u,6,3,7>
-  2295704904U, // <0,u,u,7>: Cost 2 vmrglw <2,3,0,u>, RHS
+  1146337343U, // <0,u,u,4>: Cost 2 vmrghw LHS, <u,4,5,6>
+  72595610U,   // <0,u,u,5>: Cost 1 vmrghw LHS, RHS
+  1146337488U, // <0,u,u,6>: Cost 2 vmrghw LHS, <u,6,3,7>
+  1221963080U, // <0,u,u,7>: Cost 2 vmrglw <2,3,0,u>, RHS
   835584U,     // <0,u,u,u>: Cost 0 copy LHS
-  3830595584U, // <1,0,0,0>: Cost 3 vsldoi12 <0,u,1,1>, <0,0,0,0>
-  2751545354U, // <1,0,0,1>: Cost 2 vsldoi12 <0,0,1,1>, <0,0,1,1>
+  2756853760U, // <1,0,0,0>: Cost 3 vsldoi12 <0,u,1,1>, <0,0,0,0>
+  1677803530U, // <1,0,0,1>: Cost 2 vsldoi12 <0,0,1,1>, <0,0,1,1>
   3759497387U, // <1,0,0,2>: Cost 4 vsldoi8 <0,2,1,0>, <0,2,1,0>
-  3760161020U, // <1,0,0,3>: Cost 3 vsldoi8 <0,3,1,0>, <0,3,1,0>
-  3825508389U, // <1,0,0,4>: Cost 3 vsldoi12 <0,0,4,1>, <0,0,4,1>
-  3761488286U, // <1,0,0,5>: Cost 3 vsldoi8 <0,5,1,0>, <0,5,1,0>
+  2686419196U, // <1,0,0,3>: Cost 3 vsldoi8 <0,3,1,0>, <0,3,1,0>
+  2751766565U, // <1,0,0,4>: Cost 3 vsldoi12 <0,0,4,1>, <0,0,4,1>
+  2687746462U, // <1,0,0,5>: Cost 3 vsldoi8 <0,5,1,0>, <0,5,1,0>
   3776086518U, // <1,0,0,6>: Cost 4 vsldoi8 <3,0,1,0>, <0,6,1,7>
-  3762815552U, // <1,0,0,7>: Cost 3 vsldoi8 <0,7,1,0>, <0,7,1,0>
-  2752061513U, // <1,0,0,u>: Cost 2 vsldoi12 <0,0,u,1>, <0,0,u,1>
-  3360833536U, // <1,0,1,0>: Cost 3 vmrglw <0,u,1,1>, <0,0,0,0>
-  2221310054U, // <1,0,1,1>: Cost 2 vmrghw <1,1,1,1>, LHS
-  2756853862U, // <1,0,1,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
+  2689073728U, // <1,0,0,7>: Cost 3 vsldoi8 <0,7,1,0>, <0,7,1,0>
+  1678319689U, // <1,0,0,u>: Cost 2 vsldoi12 <0,0,u,1>, <0,0,u,1>
+  2287091712U, // <1,0,1,0>: Cost 3 vmrglw <0,u,1,1>, <0,0,0,0>
+  1147568230U, // <1,0,1,1>: Cost 2 vmrghw <1,1,1,1>, LHS
+  1683112038U, // <1,0,1,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
   3294970108U, // <1,0,1,3>: Cost 4 vmrghw <1,1,0,0>, <0,3,1,0>
-  3697634614U, // <1,0,1,4>: Cost 3 vsldoi4 <1,1,0,1>, RHS
-  3721522831U, // <1,0,1,5>: Cost 3 vsldoi4 <5,1,0,1>, <5,1,0,1>
-  3865690254U, // <1,0,1,6>: Cost 3 vsldoi12 <6,7,0,1>, <0,1,6,7>
+  2623892790U, // <1,0,1,4>: Cost 3 vsldoi4 <1,1,0,1>, RHS
+  2647781007U, // <1,0,1,5>: Cost 3 vsldoi4 <5,1,0,1>, <5,1,0,1>
+  2791948430U, // <1,0,1,6>: Cost 3 vsldoi12 <6,7,0,1>, <0,1,6,7>
   3721524218U, // <1,0,1,7>: Cost 4 vsldoi4 <5,1,0,1>, <7,0,1,2>
-  2756853916U, // <1,0,1,u>: Cost 2 vsldoi12 <0,u,1,1>, LHS
-  3295854592U, // <1,0,2,0>: Cost 3 vmrghw <1,2,3,0>, <0,0,0,0>
-  2222112870U, // <1,0,2,1>: Cost 2 vmrghw <1,2,3,0>, LHS
+  1683112092U, // <1,0,1,u>: Cost 2 vsldoi12 <0,u,1,1>, LHS
+  2222112768U, // <1,0,2,0>: Cost 3 vmrghw <1,2,3,0>, <0,0,0,0>
+  1148371046U, // <1,0,2,1>: Cost 2 vmrghw <1,2,3,0>, LHS
   3356862524U, // <1,0,2,2>: Cost 4 vmrglw <0,2,1,2>, <2,u,0,2>
-  3776087718U, // <1,0,2,3>: Cost 3 vsldoi8 <3,0,1,0>, <2,3,0,1>
-  3295854930U, // <1,0,2,4>: Cost 3 vmrghw <1,2,3,0>, <0,4,1,5>
-  3373451732U, // <1,0,2,5>: Cost 3 vmrglw <3,0,1,2>, <3,4,0,5>
+  2702345894U, // <1,0,2,3>: Cost 3 vsldoi8 <3,0,1,0>, <2,3,0,1>
+  2222113106U, // <1,0,2,4>: Cost 3 vmrghw <1,2,3,0>, <0,4,1,5>
+  2299709908U, // <1,0,2,5>: Cost 3 vmrglw <3,0,1,2>, <3,4,0,5>
   3760162746U, // <1,0,2,6>: Cost 4 vsldoi8 <0,3,1,0>, <2,6,3,7>
   3369470584U, // <1,0,2,7>: Cost 4 vmrglw <2,3,1,2>, <3,6,0,7>
-  2222113437U, // <1,0,2,u>: Cost 2 vmrghw <1,2,3,0>, LHS
-  3760162966U, // <1,0,3,0>: Cost 3 vsldoi8 <0,3,1,0>, <3,0,1,2>
-  3356870310U, // <1,0,3,1>: Cost 3 vmrglw <0,2,1,3>, <2,3,0,1>
+  1148371613U, // <1,0,2,u>: Cost 2 vmrghw <1,2,3,0>, LHS
+  2686421142U, // <1,0,3,0>: Cost 3 vsldoi8 <0,3,1,0>, <3,0,1,2>
+  2283128486U, // <1,0,3,1>: Cost 3 vmrglw <0,2,1,3>, <2,3,0,1>
   3296305326U, // <1,0,3,2>: Cost 4 vmrghw <1,3,0,1>, <0,2,1,3>
   3760163199U, // <1,0,3,3>: Cost 4 vsldoi8 <0,3,1,0>, <3,3,0,1>
   3760163330U, // <1,0,3,4>: Cost 4 vsldoi8 <0,3,1,0>, <3,4,5,6>
   3779406377U, // <1,0,3,5>: Cost 4 vsldoi8 <3,5,1,0>, <3,5,1,0>
   3865690416U, // <1,0,3,6>: Cost 4 vsldoi12 <6,7,0,1>, <0,3,6,7>
   3366824568U, // <1,0,3,7>: Cost 5 vmrglw <1,u,1,3>, <3,6,0,7>
-  3781397276U, // <1,0,3,u>: Cost 3 vsldoi8 <3,u,1,0>, <3,u,1,0>
-  3808603026U, // <1,0,4,0>: Cost 3 vsldoi8 <u,4,1,0>, <4,0,5,1>
-  3830595922U, // <1,0,4,1>: Cost 3 vsldoi12 <0,u,1,1>, <0,4,1,5>
+  2707655452U, // <1,0,3,u>: Cost 3 vsldoi8 <3,u,1,0>, <3,u,1,0>
+  2734861202U, // <1,0,4,0>: Cost 3 vsldoi8 <u,4,1,0>, <4,0,5,1>
+  2756854098U, // <1,0,4,1>: Cost 3 vsldoi12 <0,u,1,1>, <0,4,1,5>
   3830595931U, // <1,0,4,2>: Cost 5 vsldoi12 <0,u,1,1>, <0,4,2,5>
   3296968960U, // <1,0,4,3>: Cost 4 vmrghw <1,4,0,1>, <0,3,1,4>
   3830595949U, // <1,0,4,4>: Cost 4 vsldoi12 <0,u,1,1>, <0,4,4,5>
-  3760164150U, // <1,0,4,5>: Cost 3 vsldoi8 <0,3,1,0>, RHS
+  2686422326U, // <1,0,4,5>: Cost 3 vsldoi8 <0,3,1,0>, RHS
   3297378806U, // <1,0,4,6>: Cost 5 vmrghw <1,4,5,6>, <0,6,1,7>
   3810594248U, // <1,0,4,7>: Cost 4 vsldoi8 <u,7,1,0>, <4,7,5,0>
-  3760164393U, // <1,0,4,u>: Cost 3 vsldoi8 <0,3,1,0>, RHS
-  3358212096U, // <1,0,5,0>: Cost 3 vmrglw <0,4,1,5>, <0,0,0,0>
-  3358213798U, // <1,0,5,1>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,1>
+  2686422569U, // <1,0,4,u>: Cost 3 vsldoi8 <0,3,1,0>, RHS
+  2284470272U, // <1,0,5,0>: Cost 3 vmrglw <0,4,1,5>, <0,0,0,0>
+  2284471974U, // <1,0,5,1>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,1>
   3809267435U, // <1,0,5,2>: Cost 4 vsldoi8 <u,5,1,0>, <5,2,1,3>
   3297968384U, // <1,0,5,3>: Cost 4 vmrghw <1,5,4,6>, <0,3,1,4>
-  3358213801U, // <1,0,5,4>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,4>
+  2284471977U, // <1,0,5,4>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,4>
   3721555603U, // <1,0,5,5>: Cost 4 vsldoi4 <5,1,0,5>, <5,1,0,5>
   3792679010U, // <1,0,5,6>: Cost 4 vsldoi8 <5,7,1,0>, <5,6,7,0>
   3792679037U, // <1,0,5,7>: Cost 4 vsldoi8 <5,7,1,0>, <5,7,1,0>
-  3358213805U, // <1,0,5,u>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,u>
+  2284471981U, // <1,0,5,u>: Cost 3 vmrglw <0,4,1,5>, <2,3,0,u>
   3356893184U, // <1,0,6,0>: Cost 4 vmrglw <0,2,1,6>, <0,0,0,0>
-  3298418790U, // <1,0,6,1>: Cost 3 vmrghw <1,6,1,7>, LHS
+  2224676966U, // <1,0,6,1>: Cost 3 vmrghw <1,6,1,7>, LHS
   3298295985U, // <1,0,6,2>: Cost 4 vmrghw <1,6,0,1>, <0,2,1,6>
   3298345212U, // <1,0,6,3>: Cost 4 vmrghw <1,6,0,7>, <0,3,1,0>
-  3298713938U, // <1,0,6,4>: Cost 3 vmrghw <1,6,5,7>, <0,4,1,5>
+  2224972114U, // <1,0,6,4>: Cost 3 vmrghw <1,6,5,7>, <0,4,1,5>
   3808604907U, // <1,0,6,5>: Cost 4 vsldoi8 <u,4,1,0>, <6,5,7,1>
   3799978808U, // <1,0,6,6>: Cost 4 vsldoi8 <7,0,1,0>, <6,6,6,6>
-  3799978830U, // <1,0,6,7>: Cost 3 vsldoi8 <7,0,1,0>, <6,7,0,1>
-  3298419346U, // <1,0,6,u>: Cost 3 vmrghw <1,6,1,7>, <0,u,1,1>
-  3799979000U, // <1,0,7,0>: Cost 3 vsldoi8 <7,0,1,0>, <7,0,1,0>
-  3359557286U, // <1,0,7,1>: Cost 3 vmrglw <0,6,1,7>, <2,3,0,1>
+  2726237006U, // <1,0,6,7>: Cost 3 vsldoi8 <7,0,1,0>, <6,7,0,1>
+  2224677522U, // <1,0,6,u>: Cost 3 vmrghw <1,6,1,7>, <0,u,1,1>
+  2726237176U, // <1,0,7,0>: Cost 3 vsldoi8 <7,0,1,0>, <7,0,1,0>
+  2285815462U, // <1,0,7,1>: Cost 3 vmrglw <0,6,1,7>, <2,3,0,1>
   3805951193U, // <1,0,7,2>: Cost 4 vsldoi8 <u,0,1,0>, <7,2,u,0>
   3807941859U, // <1,0,7,3>: Cost 4 vsldoi8 <u,3,1,0>, <7,3,0,1>
   3799979366U, // <1,0,7,4>: Cost 4 vsldoi8 <7,0,1,0>, <7,4,5,6>
   3803297165U, // <1,0,7,5>: Cost 4 vsldoi8 <7,5,1,0>, <7,5,1,0>
   3799979540U, // <1,0,7,6>: Cost 4 vsldoi8 <7,0,1,0>, <7,6,7,0>
   3799979628U, // <1,0,7,7>: Cost 4 vsldoi8 <7,0,1,0>, <7,7,7,7>
-  3805288064U, // <1,0,7,u>: Cost 3 vsldoi8 <7,u,1,0>, <7,u,1,0>
-  3358236672U, // <1,0,u,0>: Cost 3 vmrglw <0,4,1,u>, <0,0,0,0>
-  2756854418U, // <1,0,u,1>: Cost 2 vsldoi12 <0,u,1,1>, <0,u,1,1>
-  2756854429U, // <1,0,u,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
-  3807942596U, // <1,0,u,3>: Cost 3 vsldoi8 <u,3,1,0>, <u,3,1,0>
-  3830817453U, // <1,0,u,4>: Cost 3 vsldoi12 <0,u,4,1>, <0,u,4,1>
-  3760167066U, // <1,0,u,5>: Cost 3 vsldoi8 <0,3,1,0>, RHS
-  3865690254U, // <1,0,u,6>: Cost 3 vsldoi12 <6,7,0,1>, <0,1,6,7>
-  3810597128U, // <1,0,u,7>: Cost 3 vsldoi8 <u,7,1,0>, <u,7,1,0>
-  2756854483U, // <1,0,u,u>: Cost 2 vsldoi12 <0,u,1,1>, LHS
-  2684436490U, // <1,1,0,0>: Cost 2 vsldoi8 <0,0,1,1>, <0,0,1,1>
-  2689744998U, // <1,1,0,1>: Cost 2 vsldoi8 <0,u,1,1>, LHS
-  3357509782U, // <1,1,0,2>: Cost 3 vmrglw <0,3,1,0>, <3,0,1,2>
+  2731546240U, // <1,0,7,u>: Cost 3 vsldoi8 <7,u,1,0>, <7,u,1,0>
+  2284494848U, // <1,0,u,0>: Cost 3 vmrglw <0,4,1,u>, <0,0,0,0>
+  1683112594U, // <1,0,u,1>: Cost 2 vsldoi12 <0,u,1,1>, <0,u,1,1>
+  1683112605U, // <1,0,u,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
+  2734200772U, // <1,0,u,3>: Cost 3 vsldoi8 <u,3,1,0>, <u,3,1,0>
+  2757075629U, // <1,0,u,4>: Cost 3 vsldoi12 <0,u,4,1>, <0,u,4,1>
+  2686425242U, // <1,0,u,5>: Cost 3 vsldoi8 <0,3,1,0>, RHS
+  2791948430U, // <1,0,u,6>: Cost 3 vsldoi12 <6,7,0,1>, <0,1,6,7>
+  2736855304U, // <1,0,u,7>: Cost 3 vsldoi8 <u,7,1,0>, <u,7,1,0>
+  1683112659U, // <1,0,u,u>: Cost 2 vsldoi12 <0,u,1,1>, LHS
+  1610694666U, // <1,1,0,0>: Cost 2 vsldoi8 <0,0,1,1>, <0,0,1,1>
+  1616003174U, // <1,1,0,1>: Cost 2 vsldoi8 <0,u,1,1>, LHS
+  2283767958U, // <1,1,0,2>: Cost 3 vmrglw <0,3,1,0>, <3,0,1,2>
   3357507596U, // <1,1,0,3>: Cost 4 vmrglw <0,3,1,0>, <0,0,1,3>
-  3763487058U, // <1,1,0,4>: Cost 3 vsldoi8 <0,u,1,1>, <0,4,1,5>
+  2689745234U, // <1,1,0,4>: Cost 3 vsldoi8 <0,u,1,1>, <0,4,1,5>
   3357507922U, // <1,1,0,5>: Cost 4 vmrglw <0,3,1,0>, <0,4,1,5>
   3294397647U, // <1,1,0,6>: Cost 4 vmrghw <1,0,1,2>, <1,6,1,7>
   3373433334U, // <1,1,0,7>: Cost 4 vmrglw <3,0,1,0>, <0,6,1,7>
-  2689745554U, // <1,1,0,u>: Cost 2 vsldoi8 <0,u,1,1>, <0,u,1,1>
-  2623963238U, // <1,1,1,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
-  1343012966U, // <1,1,1,1>: Cost 1 vspltisw1 LHS
-  3360835734U, // <1,1,1,2>: Cost 3 vmrglw <0,u,1,1>, <3,0,1,2>
-  3360834439U, // <1,1,1,3>: Cost 3 vmrglw <0,u,1,1>, <1,2,1,3>
-  2623966518U, // <1,1,1,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
-  3360833874U, // <1,1,1,5>: Cost 3 vmrglw <0,u,1,1>, <0,4,1,5>
-  3763487951U, // <1,1,1,6>: Cost 3 vsldoi8 <0,u,1,1>, <1,6,1,7>
-  3733541962U, // <1,1,1,7>: Cost 3 vsldoi4 <7,1,1,1>, <7,1,1,1>
-  1343012966U, // <1,1,1,u>: Cost 1 vspltisw1 LHS
-  3295855340U, // <1,1,2,0>: Cost 3 vmrghw <1,2,3,0>, <1,0,2,1>
-  3830596487U, // <1,1,2,1>: Cost 3 vsldoi12 <0,u,1,1>, <1,2,1,3>
-  2222113686U, // <1,1,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
-  3763488422U, // <1,1,2,3>: Cost 3 vsldoi8 <0,u,1,1>, <2,3,0,1>
-  3691744566U, // <1,1,2,4>: Cost 3 vsldoi4 <0,1,1,2>, RHS
-  3373449554U, // <1,1,2,5>: Cost 3 vmrglw <3,0,1,2>, <0,4,1,5>
-  3763488698U, // <1,1,2,6>: Cost 3 vsldoi8 <0,u,1,1>, <2,6,3,7>
+  1616003730U, // <1,1,0,u>: Cost 2 vsldoi8 <0,u,1,1>, <0,u,1,1>
+  1550221414U, // <1,1,1,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
+  269271142U,  // <1,1,1,1>: Cost 1 vspltisw1 LHS
+  2287093910U, // <1,1,1,2>: Cost 3 vmrglw <0,u,1,1>, <3,0,1,2>
+  2287092615U, // <1,1,1,3>: Cost 3 vmrglw <0,u,1,1>, <1,2,1,3>
+  1550224694U, // <1,1,1,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
+  2287092050U, // <1,1,1,5>: Cost 3 vmrglw <0,u,1,1>, <0,4,1,5>
+  2689746127U, // <1,1,1,6>: Cost 3 vsldoi8 <0,u,1,1>, <1,6,1,7>
+  2659800138U, // <1,1,1,7>: Cost 3 vsldoi4 <7,1,1,1>, <7,1,1,1>
+  269271142U,  // <1,1,1,u>: Cost 1 vspltisw1 LHS
+  2222113516U, // <1,1,2,0>: Cost 3 vmrghw <1,2,3,0>, <1,0,2,1>
+  2756854663U, // <1,1,2,1>: Cost 3 vsldoi12 <0,u,1,1>, <1,2,1,3>
+  1148371862U, // <1,1,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
+  2689746598U, // <1,1,2,3>: Cost 3 vsldoi8 <0,u,1,1>, <2,3,0,1>
+  2618002742U, // <1,1,2,4>: Cost 3 vsldoi4 <0,1,1,2>, RHS
+  2299707730U, // <1,1,2,5>: Cost 3 vmrglw <3,0,1,2>, <0,4,1,5>
+  2689746874U, // <1,1,2,6>: Cost 3 vsldoi8 <0,u,1,1>, <2,6,3,7>
   3361506511U, // <1,1,2,7>: Cost 4 vmrglw <1,0,1,2>, <1,6,1,7>
-  2222113686U, // <1,1,2,u>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
-  3763488918U, // <1,1,3,0>: Cost 3 vsldoi8 <0,u,1,1>, <3,0,1,2>
-  3764816102U, // <1,1,3,1>: Cost 3 vsldoi8 <1,1,1,1>, <3,1,1,1>
+  1148371862U, // <1,1,2,u>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
+  2689747094U, // <1,1,3,0>: Cost 3 vsldoi8 <0,u,1,1>, <3,0,1,2>
+  2691074278U, // <1,1,3,1>: Cost 3 vsldoi8 <1,1,1,1>, <3,1,1,1>
   3356870806U, // <1,1,3,2>: Cost 4 vmrglw <0,2,1,3>, <3,0,1,2>
-  3356868782U, // <1,1,3,3>: Cost 3 vmrglw <0,2,1,3>, <0,2,1,3>
-  3763489282U, // <1,1,3,4>: Cost 3 vsldoi8 <0,u,1,1>, <3,4,5,6>
+  2283126958U, // <1,1,3,3>: Cost 3 vmrglw <0,2,1,3>, <0,2,1,3>
+  2689747458U, // <1,1,3,4>: Cost 3 vsldoi8 <0,u,1,1>, <3,4,5,6>
   3356868946U, // <1,1,3,5>: Cost 4 vmrglw <0,2,1,3>, <0,4,1,5>
   3811265144U, // <1,1,3,6>: Cost 4 vsldoi8 <u,u,1,1>, <3,6,0,7>
   3362841807U, // <1,1,3,7>: Cost 4 vmrglw <1,2,1,3>, <1,6,1,7>
-  3763489566U, // <1,1,3,u>: Cost 3 vsldoi8 <0,u,1,1>, <3,u,1,2>
-  3697729638U, // <1,1,4,0>: Cost 3 vsldoi4 <1,1,1,4>, LHS
-  3831923755U, // <1,1,4,1>: Cost 3 vsldoi12 <1,1,1,1>, <1,4,1,5>
-  3297149846U, // <1,1,4,2>: Cost 3 vmrghw <1,4,2,5>, <1,2,3,0>
+  2689747742U, // <1,1,3,u>: Cost 3 vsldoi8 <0,u,1,1>, <3,u,1,2>
+  2623987814U, // <1,1,4,0>: Cost 3 vsldoi4 <1,1,1,4>, LHS
+  2758181931U, // <1,1,4,1>: Cost 3 vsldoi12 <1,1,1,1>, <1,4,1,5>
+  2223408022U, // <1,1,4,2>: Cost 3 vmrghw <1,4,2,5>, <1,2,3,0>
   3697731734U, // <1,1,4,3>: Cost 4 vsldoi4 <1,1,1,4>, <3,0,1,2>
-  3357540608U, // <1,1,4,4>: Cost 3 vmrglw <0,3,1,4>, <0,3,1,4>
-  2689748278U, // <1,1,4,5>: Cost 2 vsldoi8 <0,u,1,1>, RHS
+  2283798784U, // <1,1,4,4>: Cost 3 vmrglw <0,3,1,4>, <0,3,1,4>
+  1616006454U, // <1,1,4,5>: Cost 2 vsldoi8 <0,u,1,1>, RHS
   3297379535U, // <1,1,4,6>: Cost 4 vmrghw <1,4,5,6>, <1,6,1,7>
   3373466102U, // <1,1,4,7>: Cost 4 vmrglw <3,0,1,4>, <0,6,1,7>
-  2689748521U, // <1,1,4,u>: Cost 2 vsldoi8 <0,u,1,1>, RHS
-  3834504303U, // <1,1,5,0>: Cost 3 vsldoi12 <1,5,0,1>, <1,5,0,1>
-  3358212106U, // <1,1,5,1>: Cost 3 vmrglw <0,4,1,5>, <0,0,1,1>
-  3358214294U, // <1,1,5,2>: Cost 3 vmrglw <0,4,1,5>, <3,0,1,2>
+  1616006697U, // <1,1,4,u>: Cost 2 vsldoi8 <0,u,1,1>, RHS
+  2760762479U, // <1,1,5,0>: Cost 3 vsldoi12 <1,5,0,1>, <1,5,0,1>
+  2284470282U, // <1,1,5,1>: Cost 3 vmrglw <0,4,1,5>, <0,0,1,1>
+  2284472470U, // <1,1,5,2>: Cost 3 vmrglw <0,4,1,5>, <3,0,1,2>
   3358212270U, // <1,1,5,3>: Cost 4 vmrglw <0,4,1,5>, <0,2,1,3>
-  3358212109U, // <1,1,5,4>: Cost 3 vmrglw <0,4,1,5>, <0,0,1,4>
-  2284470610U, // <1,1,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
-  3811266658U, // <1,1,5,6>: Cost 3 vsldoi8 <u,u,1,1>, <5,6,7,0>
+  2284470285U, // <1,1,5,4>: Cost 3 vmrglw <0,4,1,5>, <0,0,1,4>
+  1210728786U, // <1,1,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
+  2737524834U, // <1,1,5,6>: Cost 3 vsldoi8 <u,u,1,1>, <5,6,7,0>
   3360867535U, // <1,1,5,7>: Cost 4 vmrglw <0,u,1,5>, <1,6,1,7>
-  2284470610U, // <1,1,5,u>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
+  1210728786U, // <1,1,5,u>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
   3697746022U, // <1,1,6,0>: Cost 4 vsldoi4 <1,1,1,6>, LHS
-  3830596815U, // <1,1,6,1>: Cost 3 vsldoi12 <0,u,1,1>, <1,6,1,7>
-  3811267066U, // <1,1,6,2>: Cost 3 vsldoi8 <u,u,1,1>, <6,2,7,3>
+  2756854991U, // <1,1,6,1>: Cost 3 vsldoi12 <0,u,1,1>, <1,6,1,7>
+  2737525242U, // <1,1,6,2>: Cost 3 vsldoi8 <u,u,1,1>, <6,2,7,3>
   3839149281U, // <1,1,6,3>: Cost 4 vsldoi12 <2,3,0,1>, <1,6,3,7>
   3697749302U, // <1,1,6,4>: Cost 4 vsldoi4 <1,1,1,6>, RHS
   3356893522U, // <1,1,6,5>: Cost 4 vmrglw <0,2,1,6>, <0,4,1,5>
-  3356893361U, // <1,1,6,6>: Cost 3 vmrglw <0,2,1,6>, <0,2,1,6>
-  3865691390U, // <1,1,6,7>: Cost 3 vsldoi12 <6,7,0,1>, <1,6,7,0>
-  3866354951U, // <1,1,6,u>: Cost 3 vsldoi12 <6,u,0,1>, <1,6,u,0>
-  3811267578U, // <1,1,7,0>: Cost 3 vsldoi8 <u,u,1,1>, <7,0,1,2>
-  3365528210U, // <1,1,7,1>: Cost 3 vmrglw <1,6,1,7>, <0,u,1,1>
+  2283151537U, // <1,1,6,6>: Cost 3 vmrglw <0,2,1,6>, <0,2,1,6>
+  2791949566U, // <1,1,6,7>: Cost 3 vsldoi12 <6,7,0,1>, <1,6,7,0>
+  2792613127U, // <1,1,6,u>: Cost 3 vsldoi12 <6,u,0,1>, <1,6,u,0>
+  2737525754U, // <1,1,7,0>: Cost 3 vsldoi8 <u,u,1,1>, <7,0,1,2>
+  2291786386U, // <1,1,7,1>: Cost 3 vmrglw <1,6,1,7>, <0,u,1,1>
   3365528292U, // <1,1,7,2>: Cost 4 vmrglw <1,6,1,7>, <1,0,1,2>
   3365528455U, // <1,1,7,3>: Cost 4 vmrglw <1,6,1,7>, <1,2,1,3>
-  3811267942U, // <1,1,7,4>: Cost 3 vsldoi8 <u,u,1,1>, <7,4,5,6>
+  2737526118U, // <1,1,7,4>: Cost 3 vsldoi8 <u,u,1,1>, <7,4,5,6>
   3365527890U, // <1,1,7,5>: Cost 4 vmrglw <1,6,1,7>, <0,4,1,5>
   3365528377U, // <1,1,7,6>: Cost 4 vmrglw <1,6,1,7>, <1,1,1,6>
-  3365528783U, // <1,1,7,7>: Cost 3 vmrglw <1,6,1,7>, <1,6,1,7>
-  3811268226U, // <1,1,7,u>: Cost 3 vsldoi8 <u,u,1,1>, <7,u,1,2>
-  2623963238U, // <1,1,u,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
-  1343012966U, // <1,1,u,1>: Cost 1 vspltisw1 LHS
-  2222113686U, // <1,1,u,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
-  3763492796U, // <1,1,u,3>: Cost 3 vsldoi8 <0,u,1,1>, <u,3,0,1>
-  2623966518U, // <1,1,u,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
-  2689751194U, // <1,1,u,5>: Cost 2 vsldoi8 <0,u,1,1>, RHS
-  3763493072U, // <1,1,u,6>: Cost 3 vsldoi8 <0,u,1,1>, <u,6,3,7>
-  3810605321U, // <1,1,u,7>: Cost 3 vsldoi8 <u,7,1,1>, <u,7,1,1>
-  1343012966U, // <1,1,u,u>: Cost 1 vspltisw1 LHS
-  3776102400U, // <1,2,0,0>: Cost 3 vsldoi8 <3,0,1,2>, <0,0,0,0>
-  2702360678U, // <1,2,0,1>: Cost 2 vsldoi8 <3,0,1,2>, LHS
-  3759513773U, // <1,2,0,2>: Cost 3 vsldoi8 <0,2,1,2>, <0,2,1,2>
-  3357507686U, // <1,2,0,3>: Cost 3 vmrglw <0,3,1,0>, LHS
-  3776102738U, // <1,2,0,4>: Cost 3 vsldoi8 <3,0,1,2>, <0,4,1,5>
+  2291786959U, // <1,1,7,7>: Cost 3 vmrglw <1,6,1,7>, <1,6,1,7>
+  2737526402U, // <1,1,7,u>: Cost 3 vsldoi8 <u,u,1,1>, <7,u,1,2>
+  1550221414U, // <1,1,u,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
+  269271142U,  // <1,1,u,1>: Cost 1 vspltisw1 LHS
+  1148371862U, // <1,1,u,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
+  2689750972U, // <1,1,u,3>: Cost 3 vsldoi8 <0,u,1,1>, <u,3,0,1>
+  1550224694U, // <1,1,u,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
+  1616009370U, // <1,1,u,5>: Cost 2 vsldoi8 <0,u,1,1>, RHS
+  2689751248U, // <1,1,u,6>: Cost 3 vsldoi8 <0,u,1,1>, <u,6,3,7>
+  2736863497U, // <1,1,u,7>: Cost 3 vsldoi8 <u,7,1,1>, <u,7,1,1>
+  269271142U,  // <1,1,u,u>: Cost 1 vspltisw1 LHS
+  2702360576U, // <1,2,0,0>: Cost 3 vsldoi8 <3,0,1,2>, <0,0,0,0>
+  1628618854U, // <1,2,0,1>: Cost 2 vsldoi8 <3,0,1,2>, LHS
+  2685771949U, // <1,2,0,2>: Cost 3 vsldoi8 <0,2,1,2>, <0,2,1,2>
+  2283765862U, // <1,2,0,3>: Cost 3 vmrglw <0,3,1,0>, LHS
+  2702360914U, // <1,2,0,4>: Cost 3 vsldoi8 <3,0,1,2>, <0,4,1,5>
   3788046813U, // <1,2,0,5>: Cost 4 vsldoi8 <5,0,1,2>, <0,5,u,0>
-  3762168305U, // <1,2,0,6>: Cost 3 vsldoi8 <0,6,1,2>, <0,6,1,2>
-  3799990848U, // <1,2,0,7>: Cost 3 vsldoi8 <7,0,1,2>, <0,7,1,0>
-  2702361245U, // <1,2,0,u>: Cost 2 vsldoi8 <3,0,1,2>, LHS
-  3764159204U, // <1,2,1,0>: Cost 3 vsldoi8 <1,0,1,2>, <1,0,1,2>
-  3776103220U, // <1,2,1,1>: Cost 3 vsldoi8 <3,0,1,2>, <1,1,1,1>
-  3360835176U, // <1,2,1,2>: Cost 3 vmrglw <0,u,1,1>, <2,2,2,2>
-  2287091814U, // <1,2,1,3>: Cost 2 vmrglw <0,u,1,1>, LHS
+  2688426481U, // <1,2,0,6>: Cost 3 vsldoi8 <0,6,1,2>, <0,6,1,2>
+  2726249024U, // <1,2,0,7>: Cost 3 vsldoi8 <7,0,1,2>, <0,7,1,0>
+  1628619421U, // <1,2,0,u>: Cost 2 vsldoi8 <3,0,1,2>, LHS
+  2690417380U, // <1,2,1,0>: Cost 3 vsldoi8 <1,0,1,2>, <1,0,1,2>
+  2702361396U, // <1,2,1,1>: Cost 3 vsldoi8 <3,0,1,2>, <1,1,1,1>
+  2287093352U, // <1,2,1,2>: Cost 3 vmrglw <0,u,1,1>, <2,2,2,2>
+  1213349990U, // <1,2,1,3>: Cost 2 vmrglw <0,u,1,1>, LHS
   3764159522U, // <1,2,1,4>: Cost 4 vsldoi8 <1,0,1,2>, <1,4,0,5>
   3295053672U, // <1,2,1,5>: Cost 4 vmrghw <1,1,1,1>, <2,5,3,6>
-  3295053754U, // <1,2,1,6>: Cost 3 vmrghw <1,1,1,1>, <2,6,3,7>
+  2221311930U, // <1,2,1,6>: Cost 3 vmrghw <1,1,1,1>, <2,6,3,7>
   3799991593U, // <1,2,1,7>: Cost 4 vsldoi8 <7,0,1,2>, <1,7,2,7>
-  2287091819U, // <1,2,1,u>: Cost 2 vmrglw <0,u,1,1>, LHS
-  3697786982U, // <1,2,2,0>: Cost 3 vsldoi4 <1,1,2,2>, LHS
-  3776103968U, // <1,2,2,1>: Cost 3 vsldoi8 <3,0,1,2>, <2,1,3,2>
-  3356862056U, // <1,2,2,2>: Cost 3 vmrglw <0,2,1,2>, <2,2,2,2>
-  2299707494U, // <1,2,2,3>: Cost 2 vmrglw <3,0,1,2>, LHS
-  3697790262U, // <1,2,2,4>: Cost 3 vsldoi4 <1,1,2,2>, RHS
+  1213349995U, // <1,2,1,u>: Cost 2 vmrglw <0,u,1,1>, LHS
+  2624045158U, // <1,2,2,0>: Cost 3 vsldoi4 <1,1,2,2>, LHS
+  2702362144U, // <1,2,2,1>: Cost 3 vsldoi8 <3,0,1,2>, <2,1,3,2>
+  2283120232U, // <1,2,2,2>: Cost 3 vmrglw <0,2,1,2>, <2,2,2,2>
+  1225965670U, // <1,2,2,3>: Cost 2 vmrglw <3,0,1,2>, LHS
+  2624048438U, // <1,2,2,4>: Cost 3 vsldoi4 <1,1,2,2>, RHS
   3356860763U, // <1,2,2,5>: Cost 4 vmrglw <0,2,1,2>, <0,4,2,5>
-  3295856570U, // <1,2,2,6>: Cost 3 vmrghw <1,2,3,0>, <2,6,3,7>
-  3373450456U, // <1,2,2,7>: Cost 3 vmrglw <3,0,1,2>, <1,6,2,7>
-  2299707499U, // <1,2,2,u>: Cost 2 vmrglw <3,0,1,2>, LHS
-  1544339558U, // <1,2,3,0>: Cost 1 vsldoi4 LHS, LHS
-  2618082100U, // <1,2,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
-  2618082920U, // <1,2,3,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
-  2618083740U, // <1,2,3,3>: Cost 2 vsldoi4 LHS, <3,3,3,3>
-  1544342838U, // <1,2,3,4>: Cost 1 vsldoi4 LHS, RHS
-  2665861124U, // <1,2,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
-  2665861626U, // <1,2,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
-  2665862138U, // <1,2,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
-  1544345390U, // <1,2,3,u>: Cost 1 vsldoi4 LHS, LHS
-  3782077295U, // <1,2,4,0>: Cost 3 vsldoi8 <4,0,1,2>, <4,0,1,2>
+  2222114746U, // <1,2,2,6>: Cost 3 vmrghw <1,2,3,0>, <2,6,3,7>
+  2299708632U, // <1,2,2,7>: Cost 3 vmrglw <3,0,1,2>, <1,6,2,7>
+  1225965675U, // <1,2,2,u>: Cost 2 vmrglw <3,0,1,2>, LHS
+  470597734U,  // <1,2,3,0>: Cost 1 vsldoi4 LHS, LHS
+  1544340276U, // <1,2,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
+  1544341096U, // <1,2,3,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
+  1544341916U, // <1,2,3,3>: Cost 2 vsldoi4 LHS, <3,3,3,3>
+  470601014U,  // <1,2,3,4>: Cost 1 vsldoi4 LHS, RHS
+  1592119300U, // <1,2,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
+  1592119802U, // <1,2,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
+  1592120314U, // <1,2,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
+  470603566U,  // <1,2,3,u>: Cost 1 vsldoi4 LHS, LHS
+  2708335471U, // <1,2,4,0>: Cost 3 vsldoi8 <4,0,1,2>, <4,0,1,2>
   3838043908U, // <1,2,4,1>: Cost 4 vsldoi12 <2,1,3,1>, <2,4,1,5>
   3357541992U, // <1,2,4,2>: Cost 4 vmrglw <0,3,1,4>, <2,2,2,2>
-  3357540454U, // <1,2,4,3>: Cost 3 vmrglw <0,3,1,4>, LHS
-  3799993552U, // <1,2,4,4>: Cost 3 vsldoi8 <7,0,1,2>, <4,4,4,4>
-  2702363958U, // <1,2,4,5>: Cost 2 vsldoi8 <3,0,1,2>, RHS
+  2283798630U, // <1,2,4,3>: Cost 3 vmrglw <0,3,1,4>, LHS
+  2726251728U, // <1,2,4,4>: Cost 3 vsldoi8 <7,0,1,2>, <4,4,4,4>
+  1628622134U, // <1,2,4,5>: Cost 2 vsldoi8 <3,0,1,2>, RHS
   3297077178U, // <1,2,4,6>: Cost 4 vmrghw <1,4,1,5>, <2,6,3,7>
-  3799993800U, // <1,2,4,7>: Cost 3 vsldoi8 <7,0,1,2>, <4,7,5,0>
-  2702364201U, // <1,2,4,u>: Cost 2 vsldoi8 <3,0,1,2>, RHS
-  3788049992U, // <1,2,5,0>: Cost 3 vsldoi8 <5,0,1,2>, <5,0,1,2>
+  2726251976U, // <1,2,4,7>: Cost 3 vsldoi8 <7,0,1,2>, <4,7,5,0>
+  1628622377U, // <1,2,4,u>: Cost 2 vsldoi8 <3,0,1,2>, RHS
+  2714308168U, // <1,2,5,0>: Cost 3 vsldoi8 <5,0,1,2>, <5,0,1,2>
   3297633827U, // <1,2,5,1>: Cost 4 vmrghw <1,5,0,1>, <2,1,3,5>
-  3358213736U, // <1,2,5,2>: Cost 3 vmrglw <0,4,1,5>, <2,2,2,2>
-  2284470374U, // <1,2,5,3>: Cost 2 vmrglw <0,4,1,5>, LHS
+  2284471912U, // <1,2,5,2>: Cost 3 vmrglw <0,4,1,5>, <2,2,2,2>
+  1210728550U, // <1,2,5,3>: Cost 2 vmrglw <0,4,1,5>, LHS
   3776106420U, // <1,2,5,4>: Cost 4 vsldoi8 <3,0,1,2>, <5,4,5,6>
-  3799994372U, // <1,2,5,5>: Cost 3 vsldoi8 <7,0,1,2>, <5,5,5,5>
-  3799994466U, // <1,2,5,6>: Cost 3 vsldoi8 <7,0,1,2>, <5,6,7,0>
+  2726252548U, // <1,2,5,5>: Cost 3 vsldoi8 <7,0,1,2>, <5,5,5,5>
+  2726252642U, // <1,2,5,6>: Cost 3 vsldoi8 <7,0,1,2>, <5,6,7,0>
   3799994538U, // <1,2,5,7>: Cost 4 vsldoi8 <7,0,1,2>, <5,7,6,0>
-  2284470379U, // <1,2,5,u>: Cost 2 vmrglw <0,4,1,5>, LHS
-  3794022689U, // <1,2,6,0>: Cost 3 vsldoi8 <6,0,1,2>, <6,0,1,2>
-  3776106920U, // <1,2,6,1>: Cost 3 vsldoi8 <3,0,1,2>, <6,1,7,2>
-  3799994874U, // <1,2,6,2>: Cost 3 vsldoi8 <7,0,1,2>, <6,2,7,3>
-  3356893286U, // <1,2,6,3>: Cost 3 vmrglw <0,2,1,6>, LHS
+  1210728555U, // <1,2,5,u>: Cost 2 vmrglw <0,4,1,5>, LHS
+  2720280865U, // <1,2,6,0>: Cost 3 vsldoi8 <6,0,1,2>, <6,0,1,2>
+  2702365096U, // <1,2,6,1>: Cost 3 vsldoi8 <3,0,1,2>, <6,1,7,2>
+  2726253050U, // <1,2,6,2>: Cost 3 vsldoi8 <7,0,1,2>, <6,2,7,3>
+  2283151462U, // <1,2,6,3>: Cost 3 vmrglw <0,2,1,6>, LHS
   3697823030U, // <1,2,6,4>: Cost 4 vsldoi4 <1,1,2,6>, RHS
   3298715497U, // <1,2,6,5>: Cost 4 vmrghw <1,6,5,7>, <2,5,3,7>
-  3799995192U, // <1,2,6,6>: Cost 3 vsldoi8 <7,0,1,2>, <6,6,6,6>
-  3798668120U, // <1,2,6,7>: Cost 3 vsldoi8 <6,7,1,2>, <6,7,1,2>
-  3356893291U, // <1,2,6,u>: Cost 3 vmrglw <0,2,1,6>, LHS
-  2726253562U, // <1,2,7,0>: Cost 2 vsldoi8 <7,0,1,2>, <7,0,1,2>
+  2726253368U, // <1,2,6,6>: Cost 3 vsldoi8 <7,0,1,2>, <6,6,6,6>
+  2724926296U, // <1,2,6,7>: Cost 3 vsldoi8 <6,7,1,2>, <6,7,1,2>
+  2283151467U, // <1,2,6,u>: Cost 3 vmrglw <0,2,1,6>, LHS
+  1652511738U, // <1,2,7,0>: Cost 2 vsldoi8 <7,0,1,2>, <7,0,1,2>
   3371500916U, // <1,2,7,1>: Cost 4 vmrglw <2,6,1,7>, <1,u,2,1>
   3365529192U, // <1,2,7,2>: Cost 4 vmrglw <1,6,1,7>, <2,2,2,2>
-  3365527654U, // <1,2,7,3>: Cost 3 vmrglw <1,6,1,7>, LHS
-  3799995750U, // <1,2,7,4>: Cost 3 vsldoi8 <7,0,1,2>, <7,4,5,6>
+  2291785830U, // <1,2,7,3>: Cost 3 vmrglw <1,6,1,7>, LHS
+  2726253926U, // <1,2,7,4>: Cost 3 vsldoi8 <7,0,1,2>, <7,4,5,6>
   3788051845U, // <1,2,7,5>: Cost 4 vsldoi8 <5,0,1,2>, <7,5,0,1>
   3794023894U, // <1,2,7,6>: Cost 4 vsldoi8 <6,0,1,2>, <7,6,0,1>
-  3799995943U, // <1,2,7,7>: Cost 3 vsldoi8 <7,0,1,2>, <7,7,0,1>
-  2731562626U, // <1,2,7,u>: Cost 2 vsldoi8 <7,u,1,2>, <7,u,1,2>
-  1544380523U, // <1,2,u,0>: Cost 1 vsldoi4 LHS, LHS
-  2618123060U, // <1,2,u,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
-  2618123880U, // <1,2,u,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
-  2618124438U, // <1,2,u,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
-  1544383798U, // <1,2,u,4>: Cost 1 vsldoi4 LHS, RHS
-  2702366874U, // <1,2,u,5>: Cost 2 vsldoi8 <3,0,1,2>, RHS
-  2665902586U, // <1,2,u,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
-  2665903098U, // <1,2,u,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
-  1544386350U, // <1,2,u,u>: Cost 1 vsldoi4 LHS, LHS
-  3843131532U, // <1,3,0,0>: Cost 3 vsldoi12 <3,0,0,1>, <3,0,0,1>
-  3759521894U, // <1,3,0,1>: Cost 3 vsldoi8 <0,2,1,3>, LHS
-  3759521966U, // <1,3,0,2>: Cost 3 vsldoi8 <0,2,1,3>, <0,2,1,3>
-  3760185599U, // <1,3,0,3>: Cost 3 vsldoi8 <0,3,1,3>, <0,3,1,3>
-  3843426480U, // <1,3,0,4>: Cost 3 vsldoi12 <3,0,4,1>, <3,0,4,1>
+  2726254119U, // <1,2,7,7>: Cost 3 vsldoi8 <7,0,1,2>, <7,7,0,1>
+  1657820802U, // <1,2,7,u>: Cost 2 vsldoi8 <7,u,1,2>, <7,u,1,2>
+  470638699U,  // <1,2,u,0>: Cost 1 vsldoi4 LHS, LHS
+  1544381236U, // <1,2,u,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
+  1544382056U, // <1,2,u,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
+  1544382614U, // <1,2,u,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
+  470641974U,  // <1,2,u,4>: Cost 1 vsldoi4 LHS, RHS
+  1628625050U, // <1,2,u,5>: Cost 2 vsldoi8 <3,0,1,2>, RHS
+  1592160762U, // <1,2,u,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
+  1592161274U, // <1,2,u,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
+  470644526U,  // <1,2,u,u>: Cost 1 vsldoi4 LHS, LHS
+  2769389708U, // <1,3,0,0>: Cost 3 vsldoi12 <3,0,0,1>, <3,0,0,1>
+  2685780070U, // <1,3,0,1>: Cost 3 vsldoi8 <0,2,1,3>, LHS
+  2685780142U, // <1,3,0,2>: Cost 3 vsldoi8 <0,2,1,3>, <0,2,1,3>
+  2686443775U, // <1,3,0,3>: Cost 3 vsldoi8 <0,3,1,3>, <0,3,1,3>
+  2769684656U, // <1,3,0,4>: Cost 3 vsldoi12 <3,0,4,1>, <3,0,4,1>
   3357507940U, // <1,3,0,5>: Cost 4 vmrglw <0,3,1,0>, <0,4,3,5>
   3759522294U, // <1,3,0,6>: Cost 4 vsldoi8 <0,2,1,3>, <0,6,1,7>
   3357509562U, // <1,3,0,7>: Cost 4 vmrglw <0,3,1,0>, <2,6,3,7>
-  3759522461U, // <1,3,0,u>: Cost 3 vsldoi8 <0,2,1,3>, LHS
-  3360834454U, // <1,3,1,0>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,0>
-  3295054054U, // <1,3,1,1>: Cost 3 vmrghw <1,1,1,1>, <3,1,1,1>
-  3765494663U, // <1,3,1,2>: Cost 3 vsldoi8 <1,2,1,3>, <1,2,1,3>
-  3360835186U, // <1,3,1,3>: Cost 3 vmrglw <0,u,1,1>, <2,2,3,3>
-  3360834458U, // <1,3,1,4>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,4>
+  2685780637U, // <1,3,0,u>: Cost 3 vsldoi8 <0,2,1,3>, LHS
+  2287092630U, // <1,3,1,0>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,0>
+  2221312230U, // <1,3,1,1>: Cost 3 vmrghw <1,1,1,1>, <3,1,1,1>
+  2691752839U, // <1,3,1,2>: Cost 3 vsldoi8 <1,2,1,3>, <1,2,1,3>
+  2287093362U, // <1,3,1,3>: Cost 3 vmrglw <0,u,1,1>, <2,2,3,3>
+  2287092634U, // <1,3,1,4>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,4>
   3360835107U, // <1,3,1,5>: Cost 4 vmrglw <0,u,1,1>, <2,1,3,5>
   3759523041U, // <1,3,1,6>: Cost 4 vsldoi8 <0,2,1,3>, <1,6,3,7>
-  3360835514U, // <1,3,1,7>: Cost 3 vmrglw <0,u,1,1>, <2,6,3,7>
-  3360834462U, // <1,3,1,u>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,u>
-  3295856790U, // <1,3,2,0>: Cost 3 vmrghw <1,2,3,0>, <3,0,1,2>
-  3295856881U, // <1,3,2,1>: Cost 3 vmrghw <1,2,3,0>, <3,1,2,3>
-  3703834144U, // <1,3,2,2>: Cost 3 vsldoi4 <2,1,3,2>, <2,1,3,2>
-  3759523494U, // <1,3,2,3>: Cost 3 vsldoi8 <0,2,1,3>, <2,3,0,1>
-  3295857154U, // <1,3,2,4>: Cost 3 vmrghw <1,2,3,0>, <3,4,5,6>
+  2287093690U, // <1,3,1,7>: Cost 3 vmrglw <0,u,1,1>, <2,6,3,7>
+  2287092638U, // <1,3,1,u>: Cost 3 vmrglw <0,u,1,1>, <1,2,3,u>
+  2222114966U, // <1,3,2,0>: Cost 3 vmrghw <1,2,3,0>, <3,0,1,2>
+  2222115057U, // <1,3,2,1>: Cost 3 vmrghw <1,2,3,0>, <3,1,2,3>
+  2630092320U, // <1,3,2,2>: Cost 3 vsldoi4 <2,1,3,2>, <2,1,3,2>
+  2685781670U, // <1,3,2,3>: Cost 3 vsldoi8 <0,2,1,3>, <2,3,0,1>
+  2222115330U, // <1,3,2,4>: Cost 3 vmrghw <1,2,3,0>, <3,4,5,6>
   3373449572U, // <1,3,2,5>: Cost 4 vmrglw <3,0,1,2>, <0,4,3,5>
-  3295857272U, // <1,3,2,6>: Cost 3 vmrghw <1,2,3,0>, <3,6,0,7>
-  3373451194U, // <1,3,2,7>: Cost 3 vmrglw <3,0,1,2>, <2,6,3,7>
-  3295857438U, // <1,3,2,u>: Cost 3 vmrghw <1,2,3,0>, <3,u,1,2>
-  3845122431U, // <1,3,3,0>: Cost 3 vsldoi12 <3,3,0,1>, <3,3,0,1>
+  2222115448U, // <1,3,2,6>: Cost 3 vmrghw <1,2,3,0>, <3,6,0,7>
+  2299709370U, // <1,3,2,7>: Cost 3 vmrglw <3,0,1,2>, <2,6,3,7>
+  2222115614U, // <1,3,2,u>: Cost 3 vmrghw <1,2,3,0>, <3,u,1,2>
+  2771380607U, // <1,3,3,0>: Cost 3 vsldoi12 <3,3,0,1>, <3,3,0,1>
   3356874468U, // <1,3,3,1>: Cost 4 vmrglw <0,2,1,3>, <u,0,3,1>
   3759524168U, // <1,3,3,2>: Cost 4 vsldoi8 <0,2,1,3>, <3,2,3,0>
-  3357534620U, // <1,3,3,3>: Cost 3 vmrglw <0,3,1,3>, <3,3,3,3>
+  2283792796U, // <1,3,3,3>: Cost 3 vmrglw <0,3,1,3>, <3,3,3,3>
   3356869530U, // <1,3,3,4>: Cost 4 vmrglw <0,2,1,3>, <1,2,3,4>
   3721760428U, // <1,3,3,5>: Cost 4 vsldoi4 <5,1,3,3>, <5,1,3,3>
   3296496248U, // <1,3,3,6>: Cost 4 vmrghw <1,3,2,6>, <3,6,0,7>
   3356870586U, // <1,3,3,7>: Cost 4 vmrglw <0,2,1,3>, <2,6,3,7>
-  3845712327U, // <1,3,3,u>: Cost 3 vsldoi12 <3,3,u,1>, <3,3,u,1>
-  3845786064U, // <1,3,4,0>: Cost 3 vsldoi12 <3,4,0,1>, <3,4,0,1>
+  2771970503U, // <1,3,3,u>: Cost 3 vsldoi12 <3,3,u,1>, <3,3,u,1>
+  2772044240U, // <1,3,4,0>: Cost 3 vsldoi12 <3,4,0,1>, <3,4,0,1>
   3362186135U, // <1,3,4,1>: Cost 4 vmrglw <1,1,1,4>, <1,2,3,1>
   3297151280U, // <1,3,4,2>: Cost 4 vmrghw <1,4,2,5>, <3,2,0,3>
   3357542002U, // <1,3,4,3>: Cost 4 vmrglw <0,3,1,4>, <2,2,3,3>
   3357540626U, // <1,3,4,4>: Cost 4 vmrglw <0,3,1,4>, <0,3,3,4>
-  3759525174U, // <1,3,4,5>: Cost 3 vsldoi8 <0,2,1,3>, RHS
+  2685783350U, // <1,3,4,5>: Cost 3 vsldoi8 <0,2,1,3>, RHS
   3357546622U, // <1,3,4,6>: Cost 4 vmrglw <0,3,1,4>, <u,5,3,6>
   3357542330U, // <1,3,4,7>: Cost 4 vmrglw <0,3,1,4>, <2,6,3,7>
-  3759525417U, // <1,3,4,u>: Cost 3 vsldoi8 <0,2,1,3>, RHS
-  3358213014U, // <1,3,5,0>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,0>
+  2685783593U, // <1,3,4,u>: Cost 3 vsldoi8 <0,2,1,3>, RHS
+  2284471190U, // <1,3,5,0>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,0>
   3358213015U, // <1,3,5,1>: Cost 4 vmrglw <0,4,1,5>, <1,2,3,1>
-  3703858723U, // <1,3,5,2>: Cost 3 vsldoi4 <2,1,3,5>, <2,1,3,5>
-  3358213746U, // <1,3,5,3>: Cost 3 vmrglw <0,4,1,5>, <2,2,3,3>
-  3358213018U, // <1,3,5,4>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,4>
-  3358213667U, // <1,3,5,5>: Cost 3 vmrglw <0,4,1,5>, <2,1,3,5>
+  2630116899U, // <1,3,5,2>: Cost 3 vsldoi4 <2,1,3,5>, <2,1,3,5>
+  2284471922U, // <1,3,5,3>: Cost 3 vmrglw <0,4,1,5>, <2,2,3,3>
+  2284471194U, // <1,3,5,4>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,4>
+  2284471843U, // <1,3,5,5>: Cost 3 vmrglw <0,4,1,5>, <2,1,3,5>
   3358218366U, // <1,3,5,6>: Cost 4 vmrglw <0,4,1,5>, <u,5,3,6>
-  3358214074U, // <1,3,5,7>: Cost 3 vmrglw <0,4,1,5>, <2,6,3,7>
-  3358213022U, // <1,3,5,u>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,u>
-  3298494614U, // <1,3,6,0>: Cost 3 vmrghw <1,6,2,7>, <3,0,1,2>
+  2284472250U, // <1,3,5,7>: Cost 3 vmrglw <0,4,1,5>, <2,6,3,7>
+  2284471198U, // <1,3,5,u>: Cost 3 vmrglw <0,4,1,5>, <1,2,3,u>
+  2224752790U, // <1,3,6,0>: Cost 3 vmrghw <1,6,2,7>, <3,0,1,2>
   3832736385U, // <1,3,6,1>: Cost 4 vsldoi12 <1,2,3,1>, <3,6,1,7>
   3703866916U, // <1,3,6,2>: Cost 4 vsldoi4 <2,1,3,6>, <2,1,3,6>
   3356894834U, // <1,3,6,3>: Cost 4 vmrglw <0,2,1,6>, <2,2,3,3>
   3356894106U, // <1,3,6,4>: Cost 4 vmrglw <0,2,1,6>, <1,2,3,4>
   3356894755U, // <1,3,6,5>: Cost 5 vmrglw <0,2,1,6>, <2,1,3,5>
   3356899130U, // <1,3,6,6>: Cost 4 vmrglw <0,2,1,6>, <u,1,3,6>
-  3356895162U, // <1,3,6,7>: Cost 3 vmrglw <0,2,1,6>, <2,6,3,7>
-  3356895162U, // <1,3,6,u>: Cost 3 vmrglw <0,2,1,6>, <2,6,3,7>
-  3847776963U, // <1,3,7,0>: Cost 3 vsldoi12 <3,7,0,1>, <3,7,0,1>
+  2283153338U, // <1,3,6,7>: Cost 3 vmrglw <0,2,1,6>, <2,6,3,7>
+  2283153338U, // <1,3,6,u>: Cost 3 vmrglw <0,2,1,6>, <2,6,3,7>
+  2774035139U, // <1,3,7,0>: Cost 3 vsldoi12 <3,7,0,1>, <3,7,0,1>
   3703874767U, // <1,3,7,1>: Cost 4 vsldoi4 <2,1,3,7>, <1,6,1,7>
   3703875109U, // <1,3,7,2>: Cost 4 vsldoi4 <2,1,3,7>, <2,1,3,7>
   3365529202U, // <1,3,7,3>: Cost 4 vmrglw <1,6,1,7>, <2,2,3,3>
@@ -1064,205 +1064,205 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3789387159U, // <1,3,7,5>: Cost 4 vsldoi8 <5,2,1,3>, <7,5,2,1>
   3865692927U, // <1,3,7,6>: Cost 4 vsldoi12 <6,7,0,1>, <3,7,6,7>
   3363538874U, // <1,3,7,7>: Cost 4 vmrglw <1,3,1,7>, <2,6,3,7>
-  3848366859U, // <1,3,7,u>: Cost 3 vsldoi12 <3,7,u,1>, <3,7,u,1>
-  3358237590U, // <1,3,u,0>: Cost 3 vmrglw <0,4,1,u>, <1,2,3,0>
-  3759527726U, // <1,3,u,1>: Cost 3 vsldoi8 <0,2,1,3>, LHS
-  3703883302U, // <1,3,u,2>: Cost 3 vsldoi4 <2,1,3,u>, <2,1,3,u>
-  3356911704U, // <1,3,u,3>: Cost 3 vmrglw <0,2,1,u>, <2,u,3,3>
-  3358237594U, // <1,3,u,4>: Cost 3 vmrglw <0,4,1,u>, <1,2,3,4>
-  3759528090U, // <1,3,u,5>: Cost 3 vsldoi8 <0,2,1,3>, RHS
-  3295857272U, // <1,3,u,6>: Cost 3 vmrghw <1,2,3,0>, <3,6,0,7>
-  3358238650U, // <1,3,u,7>: Cost 3 vmrglw <0,4,1,u>, <2,6,3,7>
-  3759528293U, // <1,3,u,u>: Cost 3 vsldoi8 <0,2,1,3>, LHS
-  3758202893U, // <1,4,0,0>: Cost 3 vsldoi8 <0,0,1,4>, <0,0,1,4>
-  3760193638U, // <1,4,0,1>: Cost 3 vsldoi8 <0,3,1,4>, LHS
+  2774625035U, // <1,3,7,u>: Cost 3 vsldoi12 <3,7,u,1>, <3,7,u,1>
+  2284495766U, // <1,3,u,0>: Cost 3 vmrglw <0,4,1,u>, <1,2,3,0>
+  2685785902U, // <1,3,u,1>: Cost 3 vsldoi8 <0,2,1,3>, LHS
+  2630141478U, // <1,3,u,2>: Cost 3 vsldoi4 <2,1,3,u>, <2,1,3,u>
+  2283169880U, // <1,3,u,3>: Cost 3 vmrglw <0,2,1,u>, <2,u,3,3>
+  2284495770U, // <1,3,u,4>: Cost 3 vmrglw <0,4,1,u>, <1,2,3,4>
+  2685786266U, // <1,3,u,5>: Cost 3 vsldoi8 <0,2,1,3>, RHS
+  2222115448U, // <1,3,u,6>: Cost 3 vmrghw <1,2,3,0>, <3,6,0,7>
+  2284496826U, // <1,3,u,7>: Cost 3 vmrglw <0,4,1,u>, <2,6,3,7>
+  2685786469U, // <1,3,u,u>: Cost 3 vsldoi8 <0,2,1,3>, LHS
+  2684461069U, // <1,4,0,0>: Cost 3 vsldoi8 <0,0,1,4>, <0,0,1,4>
+  2686451814U, // <1,4,0,1>: Cost 3 vsldoi8 <0,3,1,4>, LHS
   3759530159U, // <1,4,0,2>: Cost 4 vsldoi8 <0,2,1,4>, <0,2,1,4>
-  3760193792U, // <1,4,0,3>: Cost 3 vsldoi8 <0,3,1,4>, <0,3,1,4>
-  3758203218U, // <1,4,0,4>: Cost 3 vsldoi8 <0,0,1,4>, <0,4,1,5>
-  2775731090U, // <1,4,0,5>: Cost 2 vsldoi12 <4,0,5,1>, <4,0,5,1>
+  2686451968U, // <1,4,0,3>: Cost 3 vsldoi8 <0,3,1,4>, <0,3,1,4>
+  2684461394U, // <1,4,0,4>: Cost 3 vsldoi8 <0,0,1,4>, <0,4,1,5>
+  1701989266U, // <1,4,0,5>: Cost 2 vsldoi12 <4,0,5,1>, <4,0,5,1>
   3776119286U, // <1,4,0,6>: Cost 4 vsldoi8 <3,0,1,4>, <0,6,1,7>
-  3762848324U, // <1,4,0,7>: Cost 3 vsldoi8 <0,7,1,4>, <0,7,1,4>
-  2775952301U, // <1,4,0,u>: Cost 2 vsldoi12 <4,0,u,1>, <4,0,u,1>
-  3295054738U, // <1,4,1,0>: Cost 3 vmrghw <1,1,1,1>, <4,0,5,1>
-  3764839223U, // <1,4,1,1>: Cost 3 vsldoi8 <1,1,1,4>, <1,1,1,4>
+  2689106500U, // <1,4,0,7>: Cost 3 vsldoi8 <0,7,1,4>, <0,7,1,4>
+  1702210477U, // <1,4,0,u>: Cost 2 vsldoi12 <4,0,u,1>, <4,0,u,1>
+  2221312914U, // <1,4,1,0>: Cost 3 vmrghw <1,1,1,1>, <4,0,5,1>
+  2691097399U, // <1,4,1,1>: Cost 3 vsldoi8 <1,1,1,4>, <1,1,1,4>
   3760194454U, // <1,4,1,2>: Cost 4 vsldoi8 <0,3,1,4>, <1,2,3,0>
   3766166489U, // <1,4,1,3>: Cost 4 vsldoi8 <1,3,1,4>, <1,3,1,4>
-  3408612560U, // <1,4,1,4>: Cost 3 vmrglw <u,u,1,1>, <4,4,4,4>
-  2221313334U, // <1,4,1,5>: Cost 2 vmrghw <1,1,1,1>, RHS
+  2334870736U, // <1,4,1,4>: Cost 3 vmrglw <u,u,1,1>, <4,4,4,4>
+  1147571510U, // <1,4,1,5>: Cost 2 vmrghw <1,1,1,1>, RHS
   3760194794U, // <1,4,1,6>: Cost 4 vsldoi8 <0,3,1,4>, <1,6,4,7>
   3867315188U, // <1,4,1,7>: Cost 4 vsldoi12 <7,0,4,1>, <4,1,7,0>
-  2221313577U, // <1,4,1,u>: Cost 2 vmrghw <1,1,1,1>, RHS
-  3295857554U, // <1,4,2,0>: Cost 3 vmrghw <1,2,3,0>, <4,0,5,1>
-  3295857636U, // <1,4,2,1>: Cost 3 vmrghw <1,2,3,0>, <4,1,5,2>
+  1147571753U, // <1,4,1,u>: Cost 2 vmrghw <1,1,1,1>, RHS
+  2222115730U, // <1,4,2,0>: Cost 3 vmrghw <1,2,3,0>, <4,0,5,1>
+  2222115812U, // <1,4,2,1>: Cost 3 vmrghw <1,2,3,0>, <4,1,5,2>
   3760195176U, // <1,4,2,2>: Cost 4 vsldoi8 <0,3,1,4>, <2,2,2,2>
-  3776120486U, // <1,4,2,3>: Cost 3 vsldoi8 <3,0,1,4>, <2,3,0,1>
-  3397340368U, // <1,4,2,4>: Cost 3 vmrglw <7,0,1,2>, <4,4,4,4>
-  2222116150U, // <1,4,2,5>: Cost 2 vmrghw <1,2,3,0>, RHS
+  2702378662U, // <1,4,2,3>: Cost 3 vsldoi8 <3,0,1,4>, <2,3,0,1>
+  2323598544U, // <1,4,2,4>: Cost 3 vmrglw <7,0,1,2>, <4,4,4,4>
+  1148374326U, // <1,4,2,5>: Cost 2 vmrghw <1,2,3,0>, RHS
   3760195514U, // <1,4,2,6>: Cost 4 vsldoi8 <0,3,1,4>, <2,6,3,7>
   3373451932U, // <1,4,2,7>: Cost 4 vmrglw <3,0,1,2>, <3,6,4,7>
-  2222116393U, // <1,4,2,u>: Cost 2 vmrghw <1,2,3,0>, RHS
-  3776120984U, // <1,4,3,0>: Cost 3 vsldoi8 <3,0,1,4>, <3,0,1,4>
+  1148374569U, // <1,4,2,u>: Cost 2 vmrghw <1,2,3,0>, RHS
+  2702379160U, // <1,4,3,0>: Cost 3 vsldoi8 <3,0,1,4>, <3,0,1,4>
   3760195840U, // <1,4,3,1>: Cost 4 vsldoi8 <0,3,1,4>, <3,1,4,0>
   3776121160U, // <1,4,3,2>: Cost 4 vsldoi8 <3,0,1,4>, <3,2,3,0>
   3760195996U, // <1,4,3,3>: Cost 4 vsldoi8 <0,3,1,4>, <3,3,3,3>
-  3760196098U, // <1,4,3,4>: Cost 3 vsldoi8 <0,3,1,4>, <3,4,5,6>
+  2686454274U, // <1,4,3,4>: Cost 3 vsldoi8 <0,3,1,4>, <3,4,5,6>
   3356870350U, // <1,4,3,5>: Cost 4 vmrglw <0,2,1,3>, <2,3,4,5>
   3800009392U, // <1,4,3,6>: Cost 4 vsldoi8 <7,0,1,4>, <3,6,7,0>
   3366824604U, // <1,4,3,7>: Cost 5 vmrglw <1,u,1,3>, <3,6,4,7>
-  3781430048U, // <1,4,3,u>: Cost 3 vsldoi8 <3,u,1,4>, <3,u,1,4>
-  3849473192U, // <1,4,4,0>: Cost 3 vsldoi12 <4,0,5,1>, <4,4,0,0>
+  2707688224U, // <1,4,3,u>: Cost 3 vsldoi8 <3,u,1,4>, <3,u,1,4>
+  2775731368U, // <1,4,4,0>: Cost 3 vsldoi12 <4,0,5,1>, <4,4,0,0>
   3830820018U, // <1,4,4,1>: Cost 4 vsldoi12 <0,u,4,1>, <4,4,1,1>
   3691980454U, // <1,4,4,2>: Cost 4 vsldoi4 <0,1,4,4>, <2,3,0,1>
   3357541282U, // <1,4,4,3>: Cost 4 vmrglw <0,3,1,4>, <1,2,4,3>
-  3854781648U, // <1,4,4,4>: Cost 3 vsldoi12 <4,u,5,1>, <4,4,4,4>
-  3760196918U, // <1,4,4,5>: Cost 3 vsldoi8 <0,3,1,4>, RHS
+  2781039824U, // <1,4,4,4>: Cost 3 vsldoi12 <4,u,5,1>, <4,4,4,4>
+  2686455094U, // <1,4,4,5>: Cost 3 vsldoi8 <0,3,1,4>, RHS
   3357541528U, // <1,4,4,6>: Cost 4 vmrglw <0,3,1,4>, <1,5,4,6>
   3810627020U, // <1,4,4,7>: Cost 4 vsldoi8 <u,7,1,4>, <4,7,5,4>
-  3760197161U, // <1,4,4,u>: Cost 3 vsldoi8 <0,3,1,4>, RHS
-  3697959014U, // <1,4,5,0>: Cost 3 vsldoi4 <1,1,4,5>, LHS
-  3358212133U, // <1,4,5,1>: Cost 3 vmrglw <0,4,1,5>, <0,0,4,1>
-  3691988646U, // <1,4,5,2>: Cost 3 vsldoi4 <0,1,4,5>, <2,3,0,1>
+  2686455337U, // <1,4,4,u>: Cost 3 vsldoi8 <0,3,1,4>, RHS
+  2624217190U, // <1,4,5,0>: Cost 3 vsldoi4 <1,1,4,5>, LHS
+  2284470309U, // <1,4,5,1>: Cost 3 vmrglw <0,4,1,5>, <0,0,4,1>
+  2618246822U, // <1,4,5,2>: Cost 3 vsldoi4 <0,1,4,5>, <2,3,0,1>
   3358212297U, // <1,4,5,3>: Cost 4 vmrglw <0,4,1,5>, <0,2,4,3>
-  3358212136U, // <1,4,5,4>: Cost 3 vmrglw <0,4,1,5>, <0,0,4,4>
-  3358212461U, // <1,4,5,5>: Cost 3 vmrglw <0,4,1,5>, <0,4,4,5>
-  2756857142U, // <1,4,5,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  2284470312U, // <1,4,5,4>: Cost 3 vmrglw <0,4,1,5>, <0,0,4,4>
+  2284470637U, // <1,4,5,5>: Cost 3 vmrglw <0,4,1,5>, <0,4,4,5>
+  1683115318U, // <1,4,5,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
   3721851898U, // <1,4,5,7>: Cost 4 vsldoi4 <5,1,4,5>, <7,0,1,2>
-  2756857160U, // <1,4,5,u>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  1683115336U, // <1,4,5,u>: Cost 2 vsldoi12 <0,u,1,1>, RHS
   3794039075U, // <1,4,6,0>: Cost 4 vsldoi8 <6,0,1,4>, <6,0,1,4>
   3830820186U, // <1,4,6,1>: Cost 4 vsldoi12 <0,u,4,1>, <4,6,1,7>
   3800011258U, // <1,4,6,2>: Cost 4 vsldoi8 <7,0,1,4>, <6,2,7,3>
   3807973938U, // <1,4,6,3>: Cost 4 vsldoi8 <u,3,1,4>, <6,3,4,5>
   3298716880U, // <1,4,6,4>: Cost 4 vmrghw <1,6,5,7>, <4,4,4,4>
-  3298422070U, // <1,4,6,5>: Cost 3 vmrghw <1,6,1,7>, RHS
+  2224680246U, // <1,4,6,5>: Cost 3 vmrghw <1,6,1,7>, RHS
   3800011576U, // <1,4,6,6>: Cost 4 vsldoi8 <7,0,1,4>, <6,6,6,6>
-  3800011598U, // <1,4,6,7>: Cost 3 vsldoi8 <7,0,1,4>, <6,7,0,1>
-  3298422313U, // <1,4,6,u>: Cost 3 vmrghw <1,6,1,7>, RHS
-  3800011772U, // <1,4,7,0>: Cost 3 vsldoi8 <7,0,1,4>, <7,0,1,4>
+  2726269774U, // <1,4,6,7>: Cost 3 vsldoi8 <7,0,1,4>, <6,7,0,1>
+  2224680489U, // <1,4,6,u>: Cost 3 vmrghw <1,6,1,7>, RHS
+  2726269948U, // <1,4,7,0>: Cost 3 vsldoi8 <7,0,1,4>, <7,0,1,4>
   3383444141U, // <1,4,7,1>: Cost 4 vmrglw <4,6,1,7>, <0,u,4,1>
   3805983961U, // <1,4,7,2>: Cost 4 vsldoi8 <u,0,1,4>, <7,2,u,0>
   3807974667U, // <1,4,7,3>: Cost 4 vsldoi8 <u,3,1,4>, <7,3,4,5>
-  3810628966U, // <1,4,7,4>: Cost 3 vsldoi8 <u,7,1,4>, <7,4,5,6>
+  2736887142U, // <1,4,7,4>: Cost 3 vsldoi8 <u,7,1,4>, <7,4,5,6>
   3365528403U, // <1,4,7,5>: Cost 4 vmrglw <1,6,1,7>, <1,1,4,5>
   3800012308U, // <1,4,7,6>: Cost 4 vsldoi8 <7,0,1,4>, <7,6,7,0>
   3800012396U, // <1,4,7,7>: Cost 4 vsldoi8 <7,0,1,4>, <7,7,7,7>
-  3805320836U, // <1,4,7,u>: Cost 3 vsldoi8 <7,u,1,4>, <7,u,1,4>
-  3697983590U, // <1,4,u,0>: Cost 3 vsldoi4 <1,1,4,u>, LHS
-  3760199470U, // <1,4,u,1>: Cost 3 vsldoi8 <0,3,1,4>, LHS
-  3692013222U, // <1,4,u,2>: Cost 3 vsldoi4 <0,1,4,u>, <2,3,0,1>
-  3807975368U, // <1,4,u,3>: Cost 3 vsldoi8 <u,3,1,4>, <u,3,1,4>
-  3763517503U, // <1,4,u,4>: Cost 3 vsldoi8 <0,u,1,4>, <u,4,5,6>
-  2226097462U, // <1,4,u,5>: Cost 2 vmrghw <1,u,3,0>, RHS
-  2756857385U, // <1,4,u,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
-  3810629900U, // <1,4,u,7>: Cost 3 vsldoi8 <u,7,1,4>, <u,7,1,4>
-  2756857403U, // <1,4,u,u>: Cost 2 vsldoi12 <0,u,1,1>, RHS
-  3760865280U, // <1,5,0,0>: Cost 3 vsldoi8 <0,4,1,5>, <0,0,0,0>
-  2687123558U, // <1,5,0,1>: Cost 2 vsldoi8 <0,4,1,5>, LHS
+  2731579012U, // <1,4,7,u>: Cost 3 vsldoi8 <7,u,1,4>, <7,u,1,4>
+  2624241766U, // <1,4,u,0>: Cost 3 vsldoi4 <1,1,4,u>, LHS
+  2686457646U, // <1,4,u,1>: Cost 3 vsldoi8 <0,3,1,4>, LHS
+  2618271398U, // <1,4,u,2>: Cost 3 vsldoi4 <0,1,4,u>, <2,3,0,1>
+  2734233544U, // <1,4,u,3>: Cost 3 vsldoi8 <u,3,1,4>, <u,3,1,4>
+  2689775679U, // <1,4,u,4>: Cost 3 vsldoi8 <0,u,1,4>, <u,4,5,6>
+  1152355638U, // <1,4,u,5>: Cost 2 vmrghw <1,u,3,0>, RHS
+  1683115561U, // <1,4,u,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  2736888076U, // <1,4,u,7>: Cost 3 vsldoi8 <u,7,1,4>, <u,7,1,4>
+  1683115579U, // <1,4,u,u>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  2687123456U, // <1,5,0,0>: Cost 3 vsldoi8 <0,4,1,5>, <0,0,0,0>
+  1613381734U, // <1,5,0,1>: Cost 2 vsldoi8 <0,4,1,5>, LHS
   3759538352U, // <1,5,0,2>: Cost 4 vsldoi8 <0,2,1,5>, <0,2,1,5>
   3760865532U, // <1,5,0,3>: Cost 4 vsldoi8 <0,4,1,5>, <0,3,1,0>
-  2687123794U, // <1,5,0,4>: Cost 2 vsldoi8 <0,4,1,5>, <0,4,1,5>
-  3761529251U, // <1,5,0,5>: Cost 3 vsldoi8 <0,5,1,5>, <0,5,1,5>
-  3855519348U, // <1,5,0,6>: Cost 3 vsldoi12 <5,0,6,1>, <5,0,6,1>
+  1613381970U, // <1,5,0,4>: Cost 2 vsldoi8 <0,4,1,5>, <0,4,1,5>
+  2687787427U, // <1,5,0,5>: Cost 3 vsldoi8 <0,5,1,5>, <0,5,1,5>
+  2781777524U, // <1,5,0,6>: Cost 3 vsldoi12 <5,0,6,1>, <5,0,6,1>
   3733828717U, // <1,5,0,7>: Cost 4 vsldoi4 <7,1,5,0>, <7,1,5,0>
-  2687124125U, // <1,5,0,u>: Cost 2 vsldoi8 <0,4,1,5>, LHS
-  3854782095U, // <1,5,1,0>: Cost 3 vsldoi12 <4,u,5,1>, <5,1,0,1>
-  3760866100U, // <1,5,1,1>: Cost 3 vsldoi8 <0,4,1,5>, <1,1,1,1>
-  3760866198U, // <1,5,1,2>: Cost 3 vsldoi8 <0,4,1,5>, <1,2,3,0>
+  1613382301U, // <1,5,0,u>: Cost 2 vsldoi8 <0,4,1,5>, LHS
+  2781040271U, // <1,5,1,0>: Cost 3 vsldoi12 <4,u,5,1>, <5,1,0,1>
+  2687124276U, // <1,5,1,1>: Cost 3 vsldoi8 <0,4,1,5>, <1,1,1,1>
+  2687124374U, // <1,5,1,2>: Cost 3 vsldoi8 <0,4,1,5>, <1,2,3,0>
   3760866297U, // <1,5,1,3>: Cost 4 vsldoi8 <0,4,1,5>, <1,3,5,0>
-  3766838315U, // <1,5,1,4>: Cost 3 vsldoi8 <1,4,1,5>, <1,4,1,5>
-  3760866415U, // <1,5,1,5>: Cost 3 vsldoi8 <0,4,1,5>, <1,5,0,1>
-  3760866547U, // <1,5,1,6>: Cost 3 vsldoi8 <0,4,1,5>, <1,6,5,7>
+  2693096491U, // <1,5,1,4>: Cost 3 vsldoi8 <1,4,1,5>, <1,4,1,5>
+  2687124591U, // <1,5,1,5>: Cost 3 vsldoi8 <0,4,1,5>, <1,5,0,1>
+  2687124723U, // <1,5,1,6>: Cost 3 vsldoi8 <0,4,1,5>, <1,6,5,7>
   3360834803U, // <1,5,1,7>: Cost 4 vmrglw <0,u,1,1>, <1,6,5,7>
-  3760866684U, // <1,5,1,u>: Cost 3 vsldoi8 <0,4,1,5>, <1,u,3,0>
-  3397340616U, // <1,5,2,0>: Cost 3 vmrglw <7,0,1,2>, <4,7,5,0>
-  3760866851U, // <1,5,2,1>: Cost 3 vsldoi8 <0,4,1,5>, <2,1,3,5>
-  3760866920U, // <1,5,2,2>: Cost 3 vsldoi8 <0,4,1,5>, <2,2,2,2>
-  3760866982U, // <1,5,2,3>: Cost 3 vsldoi8 <0,4,1,5>, <2,3,0,1>
-  3715927012U, // <1,5,2,4>: Cost 3 vsldoi4 <4,1,5,2>, <4,1,5,2>
-  3397340378U, // <1,5,2,5>: Cost 3 vmrglw <7,0,1,2>, <4,4,5,5>
-  3760867258U, // <1,5,2,6>: Cost 3 vsldoi8 <0,4,1,5>, <2,6,3,7>
+  2687124860U, // <1,5,1,u>: Cost 3 vsldoi8 <0,4,1,5>, <1,u,3,0>
+  2323598792U, // <1,5,2,0>: Cost 3 vmrglw <7,0,1,2>, <4,7,5,0>
+  2687125027U, // <1,5,2,1>: Cost 3 vsldoi8 <0,4,1,5>, <2,1,3,5>
+  2687125096U, // <1,5,2,2>: Cost 3 vsldoi8 <0,4,1,5>, <2,2,2,2>
+  2687125158U, // <1,5,2,3>: Cost 3 vsldoi8 <0,4,1,5>, <2,3,0,1>
+  2642185188U, // <1,5,2,4>: Cost 3 vsldoi4 <4,1,5,2>, <4,1,5,2>
+  2323598554U, // <1,5,2,5>: Cost 3 vmrglw <7,0,1,2>, <4,4,5,5>
+  2687125434U, // <1,5,2,6>: Cost 3 vsldoi8 <0,4,1,5>, <2,6,3,7>
   3373450483U, // <1,5,2,7>: Cost 4 vmrglw <3,0,1,2>, <1,6,5,7>
-  3760867387U, // <1,5,2,u>: Cost 3 vsldoi8 <0,4,1,5>, <2,u,0,1>
-  3760867478U, // <1,5,3,0>: Cost 3 vsldoi8 <0,4,1,5>, <3,0,1,2>
-  3386732058U, // <1,5,3,1>: Cost 3 vmrglw <5,2,1,3>, <4,u,5,1>
+  2687125563U, // <1,5,2,u>: Cost 3 vsldoi8 <0,4,1,5>, <2,u,0,1>
+  2687125654U, // <1,5,3,0>: Cost 3 vsldoi8 <0,4,1,5>, <3,0,1,2>
+  2312990234U, // <1,5,3,1>: Cost 3 vmrglw <5,2,1,3>, <4,u,5,1>
   3760867649U, // <1,5,3,2>: Cost 4 vsldoi8 <0,4,1,5>, <3,2,2,2>
-  3760867740U, // <1,5,3,3>: Cost 3 vsldoi8 <0,4,1,5>, <3,3,3,3>
-  3760867842U, // <1,5,3,4>: Cost 3 vsldoi8 <0,4,1,5>, <3,4,5,6>
+  2687125916U, // <1,5,3,3>: Cost 3 vsldoi8 <0,4,1,5>, <3,3,3,3>
+  2687126018U, // <1,5,3,4>: Cost 3 vsldoi8 <0,4,1,5>, <3,4,5,6>
   3386731738U, // <1,5,3,5>: Cost 4 vmrglw <5,2,1,3>, <4,4,5,5>
   3356871170U, // <1,5,3,6>: Cost 4 vmrglw <0,2,1,3>, <3,4,5,6>
   3808643779U, // <1,5,3,7>: Cost 4 vsldoi8 <u,4,1,5>, <3,7,0,1>
-  3760868126U, // <1,5,3,u>: Cost 3 vsldoi8 <0,4,1,5>, <3,u,1,2>
-  3715940454U, // <1,5,4,0>: Cost 3 vsldoi4 <4,1,5,4>, LHS
-  3760868322U, // <1,5,4,1>: Cost 3 vsldoi8 <0,4,1,5>, <4,1,5,0>
+  2687126302U, // <1,5,3,u>: Cost 3 vsldoi8 <0,4,1,5>, <3,u,1,2>
+  2642198630U, // <1,5,4,0>: Cost 3 vsldoi4 <4,1,5,4>, LHS
+  2687126498U, // <1,5,4,1>: Cost 3 vsldoi8 <0,4,1,5>, <4,1,5,0>
   3715941923U, // <1,5,4,2>: Cost 4 vsldoi4 <4,1,5,4>, <2,1,3,5>
   3709970701U, // <1,5,4,3>: Cost 4 vsldoi4 <3,1,5,4>, <3,1,5,4>
-  3760868560U, // <1,5,4,4>: Cost 3 vsldoi8 <0,4,1,5>, <4,4,4,4>
-  2687126838U, // <1,5,4,5>: Cost 2 vsldoi8 <0,4,1,5>, RHS
-  3357542914U, // <1,5,4,6>: Cost 3 vmrglw <0,3,1,4>, <3,4,5,6>
+  2687126736U, // <1,5,4,4>: Cost 3 vsldoi8 <0,4,1,5>, <4,4,4,4>
+  1613385014U, // <1,5,4,5>: Cost 2 vsldoi8 <0,4,1,5>, RHS
+  2283801090U, // <1,5,4,6>: Cost 3 vmrglw <0,3,1,4>, <3,4,5,6>
   3733861489U, // <1,5,4,7>: Cost 4 vsldoi4 <7,1,5,4>, <7,1,5,4>
-  2687127081U, // <1,5,4,u>: Cost 2 vsldoi8 <0,4,1,5>, RHS
-  3698032742U, // <1,5,5,0>: Cost 3 vsldoi4 <1,1,5,5>, LHS
-  3698033500U, // <1,5,5,1>: Cost 3 vsldoi4 <1,1,5,5>, <1,1,5,5>
+  1613385257U, // <1,5,4,u>: Cost 2 vsldoi8 <0,4,1,5>, RHS
+  2624290918U, // <1,5,5,0>: Cost 3 vsldoi4 <1,1,5,5>, LHS
+  2624291676U, // <1,5,5,1>: Cost 3 vsldoi4 <1,1,5,5>, <1,1,5,5>
   3698034211U, // <1,5,5,2>: Cost 4 vsldoi4 <1,1,5,5>, <2,1,3,5>
-  3358213035U, // <1,5,5,3>: Cost 3 vmrglw <0,4,1,5>, <1,2,5,3>
-  3698036022U, // <1,5,5,4>: Cost 3 vsldoi4 <1,1,5,5>, RHS
-  3358212956U, // <1,5,5,5>: Cost 3 vmrglw <0,4,1,5>, <1,1,5,5>
-  3358214658U, // <1,5,5,6>: Cost 3 vmrglw <0,4,1,5>, <3,4,5,6>
-  3358213363U, // <1,5,5,7>: Cost 3 vmrglw <0,4,1,5>, <1,6,5,7>
-  3358213040U, // <1,5,5,u>: Cost 3 vmrglw <0,4,1,5>, <1,2,5,u>
-  3859058724U, // <1,5,6,0>: Cost 3 vsldoi12 <5,6,0,1>, <5,6,0,1>
-  3854782515U, // <1,5,6,1>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,1,7>
-  3808645626U, // <1,5,6,2>: Cost 3 vsldoi8 <u,4,1,5>, <6,2,7,3>
+  2284471211U, // <1,5,5,3>: Cost 3 vmrglw <0,4,1,5>, <1,2,5,3>
+  2624294198U, // <1,5,5,4>: Cost 3 vsldoi4 <1,1,5,5>, RHS
+  2284471132U, // <1,5,5,5>: Cost 3 vmrglw <0,4,1,5>, <1,1,5,5>
+  2284472834U, // <1,5,5,6>: Cost 3 vmrglw <0,4,1,5>, <3,4,5,6>
+  2284471539U, // <1,5,5,7>: Cost 3 vmrglw <0,4,1,5>, <1,6,5,7>
+  2284471216U, // <1,5,5,u>: Cost 3 vmrglw <0,4,1,5>, <1,2,5,u>
+  2785316900U, // <1,5,6,0>: Cost 3 vsldoi12 <5,6,0,1>, <5,6,0,1>
+  2781040691U, // <1,5,6,1>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,1,7>
+  2734903802U, // <1,5,6,2>: Cost 3 vsldoi8 <u,4,1,5>, <6,2,7,3>
   3848736834U, // <1,5,6,3>: Cost 4 vsldoi12 <3,u,4,1>, <5,6,3,4>
   3298717620U, // <1,5,6,4>: Cost 4 vmrghw <1,6,5,7>, <5,4,5,6>
   3298717700U, // <1,5,6,5>: Cost 4 vmrghw <1,6,5,7>, <5,5,5,5>
-  3808645944U, // <1,5,6,6>: Cost 3 vsldoi8 <u,4,1,5>, <6,6,6,6>
-  3854782562U, // <1,5,6,7>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,7,0>
-  3854782571U, // <1,5,6,u>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,u,0>
-  3808646138U, // <1,5,7,0>: Cost 3 vsldoi8 <u,4,1,5>, <7,0,1,2>
-  3389419034U, // <1,5,7,1>: Cost 3 vmrglw <5,6,1,7>, <4,u,5,1>
+  2734904120U, // <1,5,6,6>: Cost 3 vsldoi8 <u,4,1,5>, <6,6,6,6>
+  2781040738U, // <1,5,6,7>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,7,0>
+  2781040747U, // <1,5,6,u>: Cost 3 vsldoi12 <4,u,5,1>, <5,6,u,0>
+  2734904314U, // <1,5,7,0>: Cost 3 vsldoi8 <u,4,1,5>, <7,0,1,2>
+  2315677210U, // <1,5,7,1>: Cost 3 vmrglw <5,6,1,7>, <4,u,5,1>
   3808646292U, // <1,5,7,2>: Cost 4 vsldoi8 <u,4,1,5>, <7,2,0,3>
   3808646371U, // <1,5,7,3>: Cost 4 vsldoi8 <u,4,1,5>, <7,3,0,1>
-  3808646502U, // <1,5,7,4>: Cost 3 vsldoi8 <u,4,1,5>, <7,4,5,6>
+  2734904678U, // <1,5,7,4>: Cost 3 vsldoi8 <u,4,1,5>, <7,4,5,6>
   3389418714U, // <1,5,7,5>: Cost 4 vmrglw <5,6,1,7>, <4,4,5,5>
   3365528656U, // <1,5,7,6>: Cost 4 vmrglw <1,6,1,7>, <1,4,5,6>
-  3808646764U, // <1,5,7,7>: Cost 3 vsldoi8 <u,4,1,5>, <7,7,7,7>
-  3808646786U, // <1,5,7,u>: Cost 3 vsldoi8 <u,4,1,5>, <7,u,1,2>
-  3760871123U, // <1,5,u,0>: Cost 3 vsldoi8 <0,4,1,5>, <u,0,1,2>
-  2687129390U, // <1,5,u,1>: Cost 2 vsldoi8 <0,4,1,5>, LHS
-  3760871304U, // <1,5,u,2>: Cost 3 vsldoi8 <0,4,1,5>, <u,2,3,3>
-  3760871356U, // <1,5,u,3>: Cost 3 vsldoi8 <0,4,1,5>, <u,3,0,1>
-  2734905370U, // <1,5,u,4>: Cost 2 vsldoi8 <u,4,1,5>, <u,4,1,5>
-  2687129754U, // <1,5,u,5>: Cost 2 vsldoi8 <0,4,1,5>, RHS
-  3760871632U, // <1,5,u,6>: Cost 3 vsldoi8 <0,4,1,5>, <u,6,3,7>
-  3854782724U, // <1,5,u,7>: Cost 3 vsldoi12 <4,u,5,1>, <5,u,7,0>
-  2687129957U, // <1,5,u,u>: Cost 2 vsldoi8 <0,4,1,5>, LHS
+  2734904940U, // <1,5,7,7>: Cost 3 vsldoi8 <u,4,1,5>, <7,7,7,7>
+  2734904962U, // <1,5,7,u>: Cost 3 vsldoi8 <u,4,1,5>, <7,u,1,2>
+  2687129299U, // <1,5,u,0>: Cost 3 vsldoi8 <0,4,1,5>, <u,0,1,2>
+  1613387566U, // <1,5,u,1>: Cost 2 vsldoi8 <0,4,1,5>, LHS
+  2687129480U, // <1,5,u,2>: Cost 3 vsldoi8 <0,4,1,5>, <u,2,3,3>
+  2687129532U, // <1,5,u,3>: Cost 3 vsldoi8 <0,4,1,5>, <u,3,0,1>
+  1661163546U, // <1,5,u,4>: Cost 2 vsldoi8 <u,4,1,5>, <u,4,1,5>
+  1613387930U, // <1,5,u,5>: Cost 2 vsldoi8 <0,4,1,5>, RHS
+  2687129808U, // <1,5,u,6>: Cost 3 vsldoi8 <0,4,1,5>, <u,6,3,7>
+  2781040900U, // <1,5,u,7>: Cost 3 vsldoi12 <4,u,5,1>, <5,u,7,0>
+  1613388133U, // <1,5,u,u>: Cost 2 vsldoi8 <0,4,1,5>, LHS
   3759546368U, // <1,6,0,0>: Cost 4 vsldoi8 <0,2,1,6>, <0,0,0,0>
-  3759546470U, // <1,6,0,1>: Cost 3 vsldoi8 <0,2,1,6>, LHS
-  3759546545U, // <1,6,0,2>: Cost 3 vsldoi8 <0,2,1,6>, <0,2,1,6>
+  2685804646U, // <1,6,0,1>: Cost 3 vsldoi8 <0,2,1,6>, LHS
+  2685804721U, // <1,6,0,2>: Cost 3 vsldoi8 <0,2,1,6>, <0,2,1,6>
   3861270834U, // <1,6,0,3>: Cost 4 vsldoi12 <6,0,3,1>, <6,0,3,1>
   3759546706U, // <1,6,0,4>: Cost 4 vsldoi8 <0,2,1,6>, <0,4,1,5>
-  3761537444U, // <1,6,0,5>: Cost 3 vsldoi8 <0,5,1,6>, <0,5,1,6>
-  3762201077U, // <1,6,0,6>: Cost 3 vsldoi8 <0,6,1,6>, <0,6,1,6>
-  3357510966U, // <1,6,0,7>: Cost 3 vmrglw <0,3,1,0>, RHS
-  3759547037U, // <1,6,0,u>: Cost 3 vsldoi8 <0,2,1,6>, LHS
+  2687795620U, // <1,6,0,5>: Cost 3 vsldoi8 <0,5,1,6>, <0,5,1,6>
+  2688459253U, // <1,6,0,6>: Cost 3 vsldoi8 <0,6,1,6>, <0,6,1,6>
+  2283769142U, // <1,6,0,7>: Cost 3 vmrglw <0,3,1,0>, RHS
+  2685805213U, // <1,6,0,u>: Cost 3 vsldoi8 <0,2,1,6>, LHS
   3698073702U, // <1,6,1,0>: Cost 4 vsldoi4 <1,1,6,1>, LHS
   3759547188U, // <1,6,1,1>: Cost 4 vsldoi8 <0,2,1,6>, <1,1,1,1>
-  3295056378U, // <1,6,1,2>: Cost 3 vmrghw <1,1,1,1>, <6,2,7,3>
+  2221314554U, // <1,6,1,2>: Cost 3 vmrghw <1,1,1,1>, <6,2,7,3>
   3759547401U, // <1,6,1,3>: Cost 4 vsldoi8 <0,2,1,6>, <1,3,6,7>
   3698076982U, // <1,6,1,4>: Cost 4 vsldoi4 <1,1,6,1>, RHS
   3767510141U, // <1,6,1,5>: Cost 4 vsldoi8 <1,5,1,6>, <1,5,1,6>
-  3408614200U, // <1,6,1,6>: Cost 3 vmrglw <u,u,1,1>, <6,6,6,6>
-  2287095094U, // <1,6,1,7>: Cost 2 vmrglw <0,u,1,1>, RHS
-  2287095095U, // <1,6,1,u>: Cost 2 vmrglw <0,u,1,1>, RHS
+  2334872376U, // <1,6,1,6>: Cost 3 vmrglw <u,u,1,1>, <6,6,6,6>
+  1213353270U, // <1,6,1,7>: Cost 2 vmrglw <0,u,1,1>, RHS
+  1213353271U, // <1,6,1,u>: Cost 2 vmrglw <0,u,1,1>, RHS
   3704053862U, // <1,6,2,0>: Cost 4 vsldoi4 <2,1,6,2>, LHS
   3759547961U, // <1,6,2,1>: Cost 4 vsldoi8 <0,2,1,6>, <2,1,6,0>
-  3295859194U, // <1,6,2,2>: Cost 3 vmrghw <1,2,3,0>, <6,2,7,3>
+  2222117370U, // <1,6,2,2>: Cost 3 vmrghw <1,2,3,0>, <6,2,7,3>
   3759548070U, // <1,6,2,3>: Cost 4 vsldoi8 <0,2,1,6>, <2,3,0,1>
   3704057142U, // <1,6,2,4>: Cost 4 vsldoi4 <2,1,6,2>, RHS
   3373451057U, // <1,6,2,5>: Cost 4 vmrglw <3,0,1,2>, <2,4,6,5>
-  3759548346U, // <1,6,2,6>: Cost 3 vsldoi8 <0,2,1,6>, <2,6,3,7>
-  2299710774U, // <1,6,2,7>: Cost 2 vmrglw <3,0,1,2>, RHS
-  2299710775U, // <1,6,2,u>: Cost 2 vmrglw <3,0,1,2>, RHS
+  2685806522U, // <1,6,2,6>: Cost 3 vsldoi8 <0,2,1,6>, <2,6,3,7>
+  1225968950U, // <1,6,2,7>: Cost 2 vmrglw <3,0,1,2>, RHS
+  1225968951U, // <1,6,2,u>: Cost 2 vmrglw <3,0,1,2>, RHS
   3759548566U, // <1,6,3,0>: Cost 4 vsldoi8 <0,2,1,6>, <3,0,1,2>
   3842912793U, // <1,6,3,1>: Cost 4 vsldoi12 <2,u,6,1>, <6,3,1,7>
   3759548774U, // <1,6,3,2>: Cost 4 vsldoi8 <0,2,1,6>, <3,2,6,3>
@@ -1270,81 +1270,81 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3759548930U, // <1,6,3,4>: Cost 4 vsldoi8 <0,2,1,6>, <3,4,5,6>
   3809315421U, // <1,6,3,5>: Cost 4 vsldoi8 <u,5,1,6>, <3,5,6,7>
   3386733368U, // <1,6,3,6>: Cost 4 vmrglw <5,2,1,3>, <6,6,6,6>
-  3356871990U, // <1,6,3,7>: Cost 3 vmrglw <0,2,1,3>, RHS
-  3356871991U, // <1,6,3,u>: Cost 3 vmrglw <0,2,1,3>, RHS
+  2283130166U, // <1,6,3,7>: Cost 3 vmrglw <0,2,1,3>, RHS
+  2283130167U, // <1,6,3,u>: Cost 3 vmrglw <0,2,1,3>, RHS
   3704070246U, // <1,6,4,0>: Cost 4 vsldoi4 <2,1,6,4>, LHS
   3862229608U, // <1,6,4,1>: Cost 4 vsldoi12 <6,1,7,1>, <6,4,1,5>
   3704071741U, // <1,6,4,2>: Cost 4 vsldoi4 <2,1,6,4>, <2,1,6,4>
   3721988610U, // <1,6,4,3>: Cost 4 vsldoi4 <5,1,6,4>, <3,4,5,6>
   3704073526U, // <1,6,4,4>: Cost 4 vsldoi4 <2,1,6,4>, RHS
-  3759549750U, // <1,6,4,5>: Cost 3 vsldoi8 <0,2,1,6>, RHS
+  2685807926U, // <1,6,4,5>: Cost 3 vsldoi8 <0,2,1,6>, RHS
   3865621141U, // <1,6,4,6>: Cost 4 vsldoi12 <6,6,u,1>, <6,4,6,5>
-  3357543734U, // <1,6,4,7>: Cost 3 vmrglw <0,3,1,4>, RHS
-  3759549993U, // <1,6,4,u>: Cost 3 vsldoi8 <0,2,1,6>, RHS
+  2283801910U, // <1,6,4,7>: Cost 3 vmrglw <0,3,1,4>, RHS
+  2685808169U, // <1,6,4,u>: Cost 3 vsldoi8 <0,2,1,6>, RHS
   3710050406U, // <1,6,5,0>: Cost 4 vsldoi4 <3,1,6,5>, LHS
   3710051571U, // <1,6,5,1>: Cost 4 vsldoi4 <3,1,6,5>, <1,6,5,7>
   3405989597U, // <1,6,5,2>: Cost 4 vmrglw <u,4,1,5>, <2,3,6,2>
   3358214502U, // <1,6,5,3>: Cost 4 vmrglw <0,4,1,5>, <3,2,6,3>
   3710053686U, // <1,6,5,4>: Cost 4 vsldoi4 <3,1,6,5>, RHS
   3721998025U, // <1,6,5,5>: Cost 4 vsldoi4 <5,1,6,5>, <5,1,6,5>
-  3405992760U, // <1,6,5,6>: Cost 3 vmrglw <u,4,1,5>, <6,6,6,6>
-  2284473654U, // <1,6,5,7>: Cost 2 vmrglw <0,4,1,5>, RHS
-  2284473655U, // <1,6,5,u>: Cost 2 vmrglw <0,4,1,5>, RHS
-  3865031421U, // <1,6,6,0>: Cost 3 vsldoi12 <6,6,0,1>, <6,6,0,1>
+  2332250936U, // <1,6,5,6>: Cost 3 vmrglw <u,4,1,5>, <6,6,6,6>
+  1210731830U, // <1,6,5,7>: Cost 2 vmrglw <0,4,1,5>, RHS
+  1210731831U, // <1,6,5,u>: Cost 2 vmrglw <0,4,1,5>, RHS
+  2791289597U, // <1,6,6,0>: Cost 3 vsldoi12 <6,6,0,1>, <6,6,0,1>
   3698115430U, // <1,6,6,1>: Cost 4 vsldoi4 <1,1,6,6>, <1,1,6,6>
   3698116538U, // <1,6,6,2>: Cost 4 vsldoi4 <1,1,6,6>, <2,6,3,7>
   3356894132U, // <1,6,6,3>: Cost 4 vmrglw <0,2,1,6>, <1,2,6,3>
   3698117942U, // <1,6,6,4>: Cost 4 vsldoi4 <1,1,6,6>, RHS
   3722006218U, // <1,6,6,5>: Cost 4 vsldoi4 <5,1,6,6>, <5,1,6,6>
-  3854783288U, // <1,6,6,6>: Cost 3 vsldoi12 <4,u,5,1>, <6,6,6,6>
-  3356896566U, // <1,6,6,7>: Cost 3 vmrglw <0,2,1,6>, RHS
-  3356896567U, // <1,6,6,u>: Cost 3 vmrglw <0,2,1,6>, RHS
-  2791953230U, // <1,6,7,0>: Cost 2 vsldoi12 <6,7,0,1>, <6,7,0,1>
-  3865768791U, // <1,6,7,1>: Cost 3 vsldoi12 <6,7,1,1>, <6,7,1,1>
-  3839152994U, // <1,6,7,2>: Cost 3 vsldoi12 <2,3,0,1>, <6,7,2,3>
+  2781041464U, // <1,6,6,6>: Cost 3 vsldoi12 <4,u,5,1>, <6,6,6,6>
+  2283154742U, // <1,6,6,7>: Cost 3 vmrglw <0,2,1,6>, RHS
+  2283154743U, // <1,6,6,u>: Cost 3 vmrglw <0,2,1,6>, RHS
+  1718211406U, // <1,6,7,0>: Cost 2 vsldoi12 <6,7,0,1>, <6,7,0,1>
+  2792026967U, // <1,6,7,1>: Cost 3 vsldoi12 <6,7,1,1>, <6,7,1,1>
+  2765411170U, // <1,6,7,2>: Cost 3 vsldoi12 <2,3,0,1>, <6,7,2,3>
   3854783336U, // <1,6,7,3>: Cost 4 vsldoi12 <4,u,5,1>, <6,7,3,0>
-  3854783350U, // <1,6,7,4>: Cost 3 vsldoi12 <4,u,5,1>, <6,7,4,5>
+  2781041526U, // <1,6,7,4>: Cost 3 vsldoi12 <4,u,5,1>, <6,7,4,5>
   3365528664U, // <1,6,7,5>: Cost 4 vmrglw <1,6,1,7>, <1,4,6,5>
-  3865695114U, // <1,6,7,6>: Cost 3 vsldoi12 <6,7,0,1>, <6,7,6,7>
-  3365530934U, // <1,6,7,7>: Cost 3 vmrglw <1,6,1,7>, RHS
-  2792543126U, // <1,6,7,u>: Cost 2 vsldoi12 <6,7,u,1>, <6,7,u,1>
-  2792616863U, // <1,6,u,0>: Cost 2 vsldoi12 <6,u,0,1>, <6,u,0,1>
-  3759552302U, // <1,6,u,1>: Cost 3 vsldoi8 <0,2,1,6>, LHS
-  3866506161U, // <1,6,u,2>: Cost 3 vsldoi12 <6,u,2,1>, <6,u,2,1>
+  2791953290U, // <1,6,7,6>: Cost 3 vsldoi12 <6,7,0,1>, <6,7,6,7>
+  2291789110U, // <1,6,7,7>: Cost 3 vmrglw <1,6,1,7>, RHS
+  1718801302U, // <1,6,7,u>: Cost 2 vsldoi12 <6,7,u,1>, <6,7,u,1>
+  1718875039U, // <1,6,u,0>: Cost 2 vsldoi12 <6,u,0,1>, <6,u,0,1>
+  2685810478U, // <1,6,u,1>: Cost 3 vsldoi8 <0,2,1,6>, LHS
+  2792764337U, // <1,6,u,2>: Cost 3 vsldoi12 <6,u,2,1>, <6,u,2,1>
   3759552444U, // <1,6,u,3>: Cost 4 vsldoi8 <0,2,1,6>, <u,3,0,1>
-  3854783431U, // <1,6,u,4>: Cost 3 vsldoi12 <4,u,5,1>, <6,u,4,5>
-  3759552666U, // <1,6,u,5>: Cost 3 vsldoi8 <0,2,1,6>, RHS
-  3763534032U, // <1,6,u,6>: Cost 3 vsldoi8 <0,u,1,6>, <u,6,3,7>
-  2284498230U, // <1,6,u,7>: Cost 2 vmrglw <0,4,1,u>, RHS
-  2284498231U, // <1,6,u,u>: Cost 2 vmrglw <0,4,1,u>, RHS
-  3867022320U, // <1,7,0,0>: Cost 3 vsldoi12 <7,0,0,1>, <7,0,0,1>
-  3768180838U, // <1,7,0,1>: Cost 3 vsldoi8 <1,6,1,7>, LHS
+  2781041607U, // <1,6,u,4>: Cost 3 vsldoi12 <4,u,5,1>, <6,u,4,5>
+  2685810842U, // <1,6,u,5>: Cost 3 vsldoi8 <0,2,1,6>, RHS
+  2689792208U, // <1,6,u,6>: Cost 3 vsldoi8 <0,u,1,6>, <u,6,3,7>
+  1210756406U, // <1,6,u,7>: Cost 2 vmrglw <0,4,1,u>, RHS
+  1210756407U, // <1,6,u,u>: Cost 2 vmrglw <0,4,1,u>, RHS
+  2793280496U, // <1,7,0,0>: Cost 3 vsldoi12 <7,0,0,1>, <7,0,0,1>
+  2694439014U, // <1,7,0,1>: Cost 3 vsldoi8 <1,6,1,7>, LHS
   3393343912U, // <1,7,0,2>: Cost 4 vmrglw <6,3,1,0>, <6,1,7,2>
   3397325306U, // <1,7,0,3>: Cost 4 vmrglw <7,0,1,0>, <6,2,7,3>
-  3867317268U, // <1,7,0,4>: Cost 3 vsldoi12 <7,0,4,1>, <7,0,4,1>
+  2793575444U, // <1,7,0,4>: Cost 3 vsldoi12 <7,0,4,1>, <7,0,4,1>
   3722030797U, // <1,7,0,5>: Cost 4 vsldoi4 <5,1,7,0>, <5,1,7,0>
-  3762209270U, // <1,7,0,6>: Cost 3 vsldoi8 <0,6,1,7>, <0,6,1,7>
-  3762872903U, // <1,7,0,7>: Cost 3 vsldoi8 <0,7,1,7>, <0,7,1,7>
-  3768181394U, // <1,7,0,u>: Cost 3 vsldoi8 <1,6,1,7>, <0,u,1,1>
-  3728007178U, // <1,7,1,0>: Cost 3 vsldoi4 <6,1,7,1>, <0,0,1,1>
-  3867759690U, // <1,7,1,1>: Cost 3 vsldoi12 <7,1,1,1>, <7,1,1,1>
+  2688467446U, // <1,7,0,6>: Cost 3 vsldoi8 <0,6,1,7>, <0,6,1,7>
+  2689131079U, // <1,7,0,7>: Cost 3 vsldoi8 <0,7,1,7>, <0,7,1,7>
+  2694439570U, // <1,7,0,u>: Cost 3 vsldoi8 <1,6,1,7>, <0,u,1,1>
+  2654265354U, // <1,7,1,0>: Cost 3 vsldoi4 <6,1,7,1>, <0,0,1,1>
+  2794017866U, // <1,7,1,1>: Cost 3 vsldoi12 <7,1,1,1>, <7,1,1,1>
   3768181639U, // <1,7,1,2>: Cost 4 vsldoi8 <1,6,1,7>, <1,2,1,3>
-  3408613882U, // <1,7,1,3>: Cost 3 vmrglw <u,u,1,1>, <6,2,7,3>
-  3728010550U, // <1,7,1,4>: Cost 3 vsldoi4 <6,1,7,1>, RHS
+  2334872058U, // <1,7,1,3>: Cost 3 vmrglw <u,u,1,1>, <6,2,7,3>
+  2654268726U, // <1,7,1,4>: Cost 3 vsldoi4 <6,1,7,1>, RHS
   3792069797U, // <1,7,1,5>: Cost 4 vsldoi8 <5,6,1,7>, <1,5,6,1>
-  3768181967U, // <1,7,1,6>: Cost 3 vsldoi8 <1,6,1,7>, <1,6,1,7>
-  3408614210U, // <1,7,1,7>: Cost 3 vmrglw <u,u,1,1>, <6,6,7,7>
-  3769509233U, // <1,7,1,u>: Cost 3 vsldoi8 <1,u,1,7>, <1,u,1,7>
-  3728015462U, // <1,7,2,0>: Cost 3 vsldoi4 <6,1,7,2>, LHS
-  3295859797U, // <1,7,2,1>: Cost 3 vmrghw <1,2,3,0>, <7,1,2,3>
-  3373453736U, // <1,7,2,2>: Cost 3 vmrglw <3,0,1,2>, <6,1,7,2>
-  3728017558U, // <1,7,2,3>: Cost 3 vsldoi4 <6,1,7,2>, <3,0,1,2>
-  3728018742U, // <1,7,2,4>: Cost 3 vsldoi4 <6,1,7,2>, RHS
+  2694440143U, // <1,7,1,6>: Cost 3 vsldoi8 <1,6,1,7>, <1,6,1,7>
+  2334872386U, // <1,7,1,7>: Cost 3 vmrglw <u,u,1,1>, <6,6,7,7>
+  2695767409U, // <1,7,1,u>: Cost 3 vsldoi8 <1,u,1,7>, <1,u,1,7>
+  2654273638U, // <1,7,2,0>: Cost 3 vsldoi4 <6,1,7,2>, LHS
+  2222117973U, // <1,7,2,1>: Cost 3 vmrghw <1,2,3,0>, <7,1,2,3>
+  2299711912U, // <1,7,2,2>: Cost 3 vmrglw <3,0,1,2>, <6,1,7,2>
+  2654275734U, // <1,7,2,3>: Cost 3 vsldoi4 <6,1,7,2>, <3,0,1,2>
+  2654276918U, // <1,7,2,4>: Cost 3 vsldoi4 <6,1,7,2>, RHS
   3385397675U, // <1,7,2,5>: Cost 4 vmrglw <5,0,1,2>, <6,1,7,5>
-  3728019880U, // <1,7,2,6>: Cost 3 vsldoi4 <6,1,7,2>, <6,1,7,2>
-  3397341451U, // <1,7,2,7>: Cost 3 vmrglw <7,0,1,2>, <5,u,7,7>
-  3728021294U, // <1,7,2,u>: Cost 3 vsldoi4 <6,1,7,2>, LHS
-  3869013219U, // <1,7,3,0>: Cost 3 vsldoi12 <7,3,0,1>, <7,3,0,1>
+  2654278056U, // <1,7,2,6>: Cost 3 vsldoi4 <6,1,7,2>, <6,1,7,2>
+  2323599627U, // <1,7,2,7>: Cost 3 vmrglw <7,0,1,2>, <5,u,7,7>
+  2654279470U, // <1,7,2,u>: Cost 3 vsldoi4 <6,1,7,2>, LHS
+  2795271395U, // <1,7,3,0>: Cost 3 vsldoi12 <7,3,0,1>, <7,3,0,1>
   3768183059U, // <1,7,3,1>: Cost 4 vsldoi8 <1,6,1,7>, <3,1,6,1>
   3728025254U, // <1,7,3,2>: Cost 4 vsldoi4 <6,1,7,3>, <2,3,0,1>
   3768183196U, // <1,7,3,3>: Cost 4 vsldoi8 <1,6,1,7>, <3,3,3,3>
@@ -1352,259 +1352,259 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3792071255U, // <1,7,3,5>: Cost 4 vsldoi8 <5,6,1,7>, <3,5,6,1>
   3780127361U, // <1,7,3,6>: Cost 4 vsldoi8 <3,6,1,7>, <3,6,1,7>
   3847779617U, // <1,7,3,7>: Cost 4 vsldoi12 <3,7,0,1>, <7,3,7,0>
-  3869603115U, // <1,7,3,u>: Cost 3 vsldoi12 <7,3,u,1>, <7,3,u,1>
-  3869676852U, // <1,7,4,0>: Cost 3 vsldoi12 <7,4,0,1>, <7,4,0,1>
+  2795861291U, // <1,7,3,u>: Cost 3 vsldoi12 <7,3,u,1>, <7,3,u,1>
+  2795935028U, // <1,7,4,0>: Cost 3 vsldoi12 <7,4,0,1>, <7,4,0,1>
   3728032975U, // <1,7,4,1>: Cost 4 vsldoi4 <6,1,7,4>, <1,6,1,7>
   3839153480U, // <1,7,4,2>: Cost 4 vsldoi12 <2,3,0,1>, <7,4,2,3>
   3397358074U, // <1,7,4,3>: Cost 4 vmrglw <7,0,1,4>, <6,2,7,3>
   3854783835U, // <1,7,4,4>: Cost 4 vsldoi12 <4,u,5,1>, <7,4,4,4>
-  3768184118U, // <1,7,4,5>: Cost 3 vsldoi8 <1,6,1,7>, RHS
+  2694442294U, // <1,7,4,5>: Cost 3 vsldoi8 <1,6,1,7>, RHS
   3786100058U, // <1,7,4,6>: Cost 4 vsldoi8 <4,6,1,7>, <4,6,1,7>
   3722065254U, // <1,7,4,7>: Cost 4 vsldoi4 <5,1,7,4>, <7,4,5,6>
-  3768184361U, // <1,7,4,u>: Cost 3 vsldoi8 <1,6,1,7>, RHS
-  3728040038U, // <1,7,5,0>: Cost 3 vsldoi4 <6,1,7,5>, LHS
+  2694442537U, // <1,7,4,u>: Cost 3 vsldoi8 <1,6,1,7>, RHS
+  2654298214U, // <1,7,5,0>: Cost 3 vsldoi4 <6,1,7,5>, LHS
   3854783893U, // <1,7,5,1>: Cost 4 vsldoi12 <4,u,5,1>, <7,5,1,u>
   3710126010U, // <1,7,5,2>: Cost 4 vsldoi4 <3,1,7,5>, <2,6,3,7>
-  3405992442U, // <1,7,5,3>: Cost 3 vmrglw <u,4,1,5>, <6,2,7,3>
-  3728043318U, // <1,7,5,4>: Cost 3 vsldoi4 <6,1,7,5>, RHS
-  3358216619U, // <1,7,5,5>: Cost 3 vmrglw <0,4,1,5>, <6,1,7,5>
-  3792072755U, // <1,7,5,6>: Cost 3 vsldoi8 <5,6,1,7>, <5,6,1,7>
-  3405992770U, // <1,7,5,7>: Cost 3 vmrglw <u,4,1,5>, <6,6,7,7>
-  3793400021U, // <1,7,5,u>: Cost 3 vsldoi8 <5,u,1,7>, <5,u,1,7>
-  3406663778U, // <1,7,6,0>: Cost 3 vmrglw <u,5,1,6>, <5,6,7,0>
+  2332250618U, // <1,7,5,3>: Cost 3 vmrglw <u,4,1,5>, <6,2,7,3>
+  2654301494U, // <1,7,5,4>: Cost 3 vsldoi4 <6,1,7,5>, RHS
+  2284474795U, // <1,7,5,5>: Cost 3 vmrglw <0,4,1,5>, <6,1,7,5>
+  2718330931U, // <1,7,5,6>: Cost 3 vsldoi8 <5,6,1,7>, <5,6,1,7>
+  2332250946U, // <1,7,5,7>: Cost 3 vmrglw <u,4,1,5>, <6,6,7,7>
+  2719658197U, // <1,7,5,u>: Cost 3 vsldoi8 <5,u,1,7>, <5,u,1,7>
+  2332921954U, // <1,7,6,0>: Cost 3 vmrglw <u,5,1,6>, <5,6,7,0>
   3768185254U, // <1,7,6,1>: Cost 4 vsldoi8 <1,6,1,7>, <6,1,7,0>
   3710134202U, // <1,7,6,2>: Cost 4 vsldoi4 <3,1,7,6>, <2,6,3,7>
   3710134561U, // <1,7,6,3>: Cost 4 vsldoi4 <3,1,7,6>, <3,1,7,6>
   3710135606U, // <1,7,6,4>: Cost 4 vsldoi4 <3,1,7,6>, RHS
   3864884745U, // <1,7,6,5>: Cost 4 vsldoi12 <6,5,7,1>, <7,6,5,7>
   3854784017U, // <1,7,6,6>: Cost 4 vsldoi12 <4,u,5,1>, <7,6,6,6>
-  3865695764U, // <1,7,6,7>: Cost 3 vsldoi12 <6,7,0,1>, <7,6,7,0>
-  3866359325U, // <1,7,6,u>: Cost 3 vsldoi12 <6,u,0,1>, <7,6,u,0>
-  3871667751U, // <1,7,7,0>: Cost 3 vsldoi12 <7,7,0,1>, <7,7,0,1>
+  2791953940U, // <1,7,6,7>: Cost 3 vsldoi12 <6,7,0,1>, <7,6,7,0>
+  2792617501U, // <1,7,6,u>: Cost 3 vsldoi12 <6,u,0,1>, <7,6,u,0>
+  2797925927U, // <1,7,7,0>: Cost 3 vsldoi12 <7,7,0,1>, <7,7,0,1>
   3365528426U, // <1,7,7,1>: Cost 4 vmrglw <1,6,1,7>, <1,1,7,1>
   3728058022U, // <1,7,7,2>: Cost 4 vsldoi4 <6,1,7,7>, <2,3,0,1>
   3365528509U, // <1,7,7,3>: Cost 4 vmrglw <1,6,1,7>, <1,2,7,3>
   3854784079U, // <1,7,7,4>: Cost 4 vsldoi12 <4,u,5,1>, <7,7,4,5>
   3722088148U, // <1,7,7,5>: Cost 4 vsldoi4 <5,1,7,7>, <5,1,7,7>
   3728060845U, // <1,7,7,6>: Cost 4 vsldoi4 <6,1,7,7>, <6,1,7,7>
-  3854784108U, // <1,7,7,7>: Cost 3 vsldoi12 <4,u,5,1>, <7,7,7,7>
-  3872257647U, // <1,7,7,u>: Cost 3 vsldoi12 <7,7,u,1>, <7,7,u,1>
-  3728064529U, // <1,7,u,0>: Cost 3 vsldoi4 <6,1,7,u>, <0,0,1,u>
-  3768186670U, // <1,7,u,1>: Cost 3 vsldoi8 <1,6,1,7>, LHS
-  3373453736U, // <1,7,u,2>: Cost 3 vmrglw <3,0,1,2>, <6,1,7,2>
-  3397390842U, // <1,7,u,3>: Cost 3 vmrglw <7,0,1,u>, <6,2,7,3>
-  3728067894U, // <1,7,u,4>: Cost 3 vsldoi4 <6,1,7,u>, RHS
-  3768187034U, // <1,7,u,5>: Cost 3 vsldoi8 <1,6,1,7>, RHS
-  3728069038U, // <1,7,u,6>: Cost 3 vsldoi4 <6,1,7,u>, <6,1,7,u>
-  3397391170U, // <1,7,u,7>: Cost 3 vmrglw <7,0,1,u>, <6,6,7,7>
-  3768187237U, // <1,7,u,u>: Cost 3 vsldoi8 <1,6,1,7>, LHS
-  2684493841U, // <1,u,0,0>: Cost 2 vsldoi8 <0,0,1,u>, <0,0,1,u>
-  2687148134U, // <1,u,0,1>: Cost 2 vsldoi8 <0,4,1,u>, LHS
-  3759562931U, // <1,u,0,2>: Cost 3 vsldoi8 <0,2,1,u>, <0,2,1,u>
-  3357507740U, // <1,u,0,3>: Cost 3 vmrglw <0,3,1,0>, LHS
-  2687148373U, // <1,u,0,4>: Cost 2 vsldoi8 <0,4,1,u>, <0,4,1,u>
-  2799621878U, // <1,u,0,5>: Cost 2 vsldoi12 <u,0,5,1>, <u,0,5,1>
-  3762217463U, // <1,u,0,6>: Cost 3 vsldoi8 <0,6,1,u>, <0,6,1,u>
-  3357510984U, // <1,u,0,7>: Cost 3 vmrglw <0,3,1,0>, RHS
-  2687148701U, // <1,u,0,u>: Cost 2 vsldoi8 <0,4,1,u>, LHS
-  2623963238U, // <1,u,1,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
-  1343012966U, // <1,u,1,1>: Cost 1 vspltisw1 LHS
-  2756859694U, // <1,u,1,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
-  2287091868U, // <1,u,1,3>: Cost 2 vmrglw <0,u,1,1>, LHS
-  2623966518U, // <1,u,1,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
-  2221316250U, // <1,u,1,5>: Cost 2 vmrghw <1,1,1,1>, RHS
-  3760891150U, // <1,u,1,6>: Cost 3 vsldoi8 <0,4,1,u>, <1,6,u,7>
-  2287095112U, // <1,u,1,7>: Cost 2 vmrglw <0,u,1,1>, RHS
-  1343012966U, // <1,u,1,u>: Cost 1 vspltisw1 LHS
-  3295860435U, // <1,u,2,0>: Cost 3 vmrghw <1,2,3,0>, <u,0,1,2>
-  2222118702U, // <1,u,2,1>: Cost 2 vmrghw <1,2,3,0>, LHS
-  2222113686U, // <1,u,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
-  2299707548U, // <1,u,2,3>: Cost 2 vmrglw <3,0,1,2>, LHS
-  3295860799U, // <1,u,2,4>: Cost 3 vmrghw <1,2,3,0>, <u,4,5,6>
-  2222119066U, // <1,u,2,5>: Cost 2 vmrghw <1,2,3,0>, RHS
-  3760891834U, // <1,u,2,6>: Cost 3 vsldoi8 <0,4,1,u>, <2,6,3,7>
-  2299710792U, // <1,u,2,7>: Cost 2 vmrglw <3,0,1,2>, RHS
-  2222119269U, // <1,u,2,u>: Cost 2 vmrghw <1,2,3,0>, LHS
-  1544781980U, // <1,u,3,0>: Cost 1 vsldoi4 LHS, LHS
-  2618524468U, // <1,u,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
-  2618525288U, // <1,u,3,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
-  2618525846U, // <1,u,3,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
-  1544785206U, // <1,u,3,4>: Cost 1 vsldoi4 LHS, RHS
-  2666303492U, // <1,u,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
-  2666303994U, // <1,u,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
-  2666304506U, // <1,u,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
-  1544787758U, // <1,u,3,u>: Cost 1 vsldoi4 LHS, LHS
-  3782126453U, // <1,u,4,0>: Cost 3 vsldoi8 <4,0,1,u>, <4,0,1,u>
-  3760892925U, // <1,u,4,1>: Cost 3 vsldoi8 <0,4,1,u>, <4,1,u,0>
-  3297149846U, // <1,u,4,2>: Cost 3 vmrghw <1,4,2,5>, <1,2,3,0>
-  3357540508U, // <1,u,4,3>: Cost 3 vmrglw <0,3,1,4>, LHS
-  3716164609U, // <1,u,4,4>: Cost 3 vsldoi4 <4,1,u,4>, <4,1,u,4>
-  2687151414U, // <1,u,4,5>: Cost 2 vsldoi8 <0,4,1,u>, RHS
-  3357542914U, // <1,u,4,6>: Cost 3 vmrglw <0,3,1,4>, <3,4,5,6>
-  3357543752U, // <1,u,4,7>: Cost 3 vmrglw <0,3,1,4>, RHS
-  2687151657U, // <1,u,4,u>: Cost 2 vsldoi8 <0,4,1,u>, RHS
-  3358213059U, // <1,u,5,0>: Cost 3 vmrglw <0,4,1,5>, <1,2,u,0>
-  3358213870U, // <1,u,5,1>: Cost 3 vmrglw <0,4,1,5>, <2,3,u,1>
-  3358214357U, // <1,u,5,2>: Cost 3 vmrglw <0,4,1,5>, <3,0,u,2>
-  2284470428U, // <1,u,5,3>: Cost 2 vmrglw <0,4,1,5>, LHS
-  3358213063U, // <1,u,5,4>: Cost 3 vmrglw <0,4,1,5>, <1,2,u,4>
-  2284470610U, // <1,u,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
-  2756860058U, // <1,u,5,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
-  2284473672U, // <1,u,5,7>: Cost 2 vmrglw <0,4,1,5>, RHS
-  2284470433U, // <1,u,5,u>: Cost 2 vmrglw <0,4,1,5>, LHS
-  3794071847U, // <1,u,6,0>: Cost 3 vsldoi8 <6,0,1,u>, <6,0,1,u>
-  3831118014U, // <1,u,6,1>: Cost 3 vsldoi12 <0,u,u,1>, <u,6,1,7>
-  3800044026U, // <1,u,6,2>: Cost 3 vsldoi8 <7,0,1,u>, <6,2,7,3>
-  3356893340U, // <1,u,6,3>: Cost 3 vmrglw <0,2,1,6>, LHS
-  3298713938U, // <1,u,6,4>: Cost 3 vmrghw <1,6,5,7>, <0,4,1,5>
-  3298424986U, // <1,u,6,5>: Cost 3 vmrghw <1,6,1,7>, RHS
-  3800044344U, // <1,u,6,6>: Cost 3 vsldoi8 <7,0,1,u>, <6,6,6,6>
-  3356896584U, // <1,u,6,7>: Cost 3 vmrglw <0,2,1,6>, RHS
-  3356893345U, // <1,u,6,u>: Cost 3 vmrglw <0,2,1,6>, LHS
-  2726302720U, // <1,u,7,0>: Cost 2 vsldoi8 <7,0,1,u>, <7,0,1,u>
-  3407332049U, // <1,u,7,1>: Cost 3 vmrglw <u,6,1,7>, <0,u,u,1>
-  3839154452U, // <1,u,7,2>: Cost 3 vsldoi12 <2,3,0,1>, <u,7,2,3>
-  3365527708U, // <1,u,7,3>: Cost 3 vmrglw <1,6,1,7>, LHS
-  3854784808U, // <1,u,7,4>: Cost 3 vsldoi12 <4,u,5,1>, <u,7,4,5>
+  2781042284U, // <1,7,7,7>: Cost 3 vsldoi12 <4,u,5,1>, <7,7,7,7>
+  2798515823U, // <1,7,7,u>: Cost 3 vsldoi12 <7,7,u,1>, <7,7,u,1>
+  2654322705U, // <1,7,u,0>: Cost 3 vsldoi4 <6,1,7,u>, <0,0,1,u>
+  2694444846U, // <1,7,u,1>: Cost 3 vsldoi8 <1,6,1,7>, LHS
+  2299711912U, // <1,7,u,2>: Cost 3 vmrglw <3,0,1,2>, <6,1,7,2>
+  2323649018U, // <1,7,u,3>: Cost 3 vmrglw <7,0,1,u>, <6,2,7,3>
+  2654326070U, // <1,7,u,4>: Cost 3 vsldoi4 <6,1,7,u>, RHS
+  2694445210U, // <1,7,u,5>: Cost 3 vsldoi8 <1,6,1,7>, RHS
+  2654327214U, // <1,7,u,6>: Cost 3 vsldoi4 <6,1,7,u>, <6,1,7,u>
+  2323649346U, // <1,7,u,7>: Cost 3 vmrglw <7,0,1,u>, <6,6,7,7>
+  2694445413U, // <1,7,u,u>: Cost 3 vsldoi8 <1,6,1,7>, LHS
+  1610752017U, // <1,u,0,0>: Cost 2 vsldoi8 <0,0,1,u>, <0,0,1,u>
+  1613406310U, // <1,u,0,1>: Cost 2 vsldoi8 <0,4,1,u>, LHS
+  2685821107U, // <1,u,0,2>: Cost 3 vsldoi8 <0,2,1,u>, <0,2,1,u>
+  2283765916U, // <1,u,0,3>: Cost 3 vmrglw <0,3,1,0>, LHS
+  1613406549U, // <1,u,0,4>: Cost 2 vsldoi8 <0,4,1,u>, <0,4,1,u>
+  1725880054U, // <1,u,0,5>: Cost 2 vsldoi12 <u,0,5,1>, <u,0,5,1>
+  2688475639U, // <1,u,0,6>: Cost 3 vsldoi8 <0,6,1,u>, <0,6,1,u>
+  2283769160U, // <1,u,0,7>: Cost 3 vmrglw <0,3,1,0>, RHS
+  1613406877U, // <1,u,0,u>: Cost 2 vsldoi8 <0,4,1,u>, LHS
+  1550221414U, // <1,u,1,0>: Cost 2 vsldoi4 <1,1,1,1>, LHS
+  269271142U,  // <1,u,1,1>: Cost 1 vspltisw1 LHS
+  1683117870U, // <1,u,1,2>: Cost 2 vsldoi12 <0,u,1,1>, LHS
+  1213350044U, // <1,u,1,3>: Cost 2 vmrglw <0,u,1,1>, LHS
+  1550224694U, // <1,u,1,4>: Cost 2 vsldoi4 <1,1,1,1>, RHS
+  1147574426U, // <1,u,1,5>: Cost 2 vmrghw <1,1,1,1>, RHS
+  2687149326U, // <1,u,1,6>: Cost 3 vsldoi8 <0,4,1,u>, <1,6,u,7>
+  1213353288U, // <1,u,1,7>: Cost 2 vmrglw <0,u,1,1>, RHS
+  269271142U,  // <1,u,1,u>: Cost 1 vspltisw1 LHS
+  2222118611U, // <1,u,2,0>: Cost 3 vmrghw <1,2,3,0>, <u,0,1,2>
+  1148376878U, // <1,u,2,1>: Cost 2 vmrghw <1,2,3,0>, LHS
+  1148371862U, // <1,u,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
+  1225965724U, // <1,u,2,3>: Cost 2 vmrglw <3,0,1,2>, LHS
+  2222118975U, // <1,u,2,4>: Cost 3 vmrghw <1,2,3,0>, <u,4,5,6>
+  1148377242U, // <1,u,2,5>: Cost 2 vmrghw <1,2,3,0>, RHS
+  2687150010U, // <1,u,2,6>: Cost 3 vsldoi8 <0,4,1,u>, <2,6,3,7>
+  1225968968U, // <1,u,2,7>: Cost 2 vmrglw <3,0,1,2>, RHS
+  1148377445U, // <1,u,2,u>: Cost 2 vmrghw <1,2,3,0>, LHS
+  471040156U,  // <1,u,3,0>: Cost 1 vsldoi4 LHS, LHS
+  1544782644U, // <1,u,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
+  1544783464U, // <1,u,3,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
+  1544784022U, // <1,u,3,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
+  471043382U,  // <1,u,3,4>: Cost 1 vsldoi4 LHS, RHS
+  1592561668U, // <1,u,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
+  1592562170U, // <1,u,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
+  1592562682U, // <1,u,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
+  471045934U,  // <1,u,3,u>: Cost 1 vsldoi4 LHS, LHS
+  2708384629U, // <1,u,4,0>: Cost 3 vsldoi8 <4,0,1,u>, <4,0,1,u>
+  2687151101U, // <1,u,4,1>: Cost 3 vsldoi8 <0,4,1,u>, <4,1,u,0>
+  2223408022U, // <1,u,4,2>: Cost 3 vmrghw <1,4,2,5>, <1,2,3,0>
+  2283798684U, // <1,u,4,3>: Cost 3 vmrglw <0,3,1,4>, LHS
+  2642422785U, // <1,u,4,4>: Cost 3 vsldoi4 <4,1,u,4>, <4,1,u,4>
+  1613409590U, // <1,u,4,5>: Cost 2 vsldoi8 <0,4,1,u>, RHS
+  2283801090U, // <1,u,4,6>: Cost 3 vmrglw <0,3,1,4>, <3,4,5,6>
+  2283801928U, // <1,u,4,7>: Cost 3 vmrglw <0,3,1,4>, RHS
+  1613409833U, // <1,u,4,u>: Cost 2 vsldoi8 <0,4,1,u>, RHS
+  2284471235U, // <1,u,5,0>: Cost 3 vmrglw <0,4,1,5>, <1,2,u,0>
+  2284472046U, // <1,u,5,1>: Cost 3 vmrglw <0,4,1,5>, <2,3,u,1>
+  2284472533U, // <1,u,5,2>: Cost 3 vmrglw <0,4,1,5>, <3,0,u,2>
+  1210728604U, // <1,u,5,3>: Cost 2 vmrglw <0,4,1,5>, LHS
+  2284471239U, // <1,u,5,4>: Cost 3 vmrglw <0,4,1,5>, <1,2,u,4>
+  1210728786U, // <1,u,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
+  1683118234U, // <1,u,5,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  1210731848U, // <1,u,5,7>: Cost 2 vmrglw <0,4,1,5>, RHS
+  1210728609U, // <1,u,5,u>: Cost 2 vmrglw <0,4,1,5>, LHS
+  2720330023U, // <1,u,6,0>: Cost 3 vsldoi8 <6,0,1,u>, <6,0,1,u>
+  2757376190U, // <1,u,6,1>: Cost 3 vsldoi12 <0,u,u,1>, <u,6,1,7>
+  2726302202U, // <1,u,6,2>: Cost 3 vsldoi8 <7,0,1,u>, <6,2,7,3>
+  2283151516U, // <1,u,6,3>: Cost 3 vmrglw <0,2,1,6>, LHS
+  2224972114U, // <1,u,6,4>: Cost 3 vmrghw <1,6,5,7>, <0,4,1,5>
+  2224683162U, // <1,u,6,5>: Cost 3 vmrghw <1,6,1,7>, RHS
+  2726302520U, // <1,u,6,6>: Cost 3 vsldoi8 <7,0,1,u>, <6,6,6,6>
+  2283154760U, // <1,u,6,7>: Cost 3 vmrglw <0,2,1,6>, RHS
+  2283151521U, // <1,u,6,u>: Cost 3 vmrglw <0,2,1,6>, LHS
+  1652560896U, // <1,u,7,0>: Cost 2 vsldoi8 <7,0,1,u>, <7,0,1,u>
+  2333590225U, // <1,u,7,1>: Cost 3 vmrglw <u,6,1,7>, <0,u,u,1>
+  2765412628U, // <1,u,7,2>: Cost 3 vsldoi12 <2,3,0,1>, <u,7,2,3>
+  2291785884U, // <1,u,7,3>: Cost 3 vmrglw <1,6,1,7>, LHS
+  2781042984U, // <1,u,7,4>: Cost 3 vsldoi12 <4,u,5,1>, <u,7,4,5>
   3365527953U, // <1,u,7,5>: Cost 4 vmrglw <1,6,1,7>, <0,4,u,5>
-  3865696572U, // <1,u,7,6>: Cost 3 vsldoi12 <6,7,0,1>, <u,7,6,7>
-  3365530952U, // <1,u,7,7>: Cost 3 vmrglw <1,6,1,7>, RHS
-  2731611784U, // <1,u,7,u>: Cost 2 vsldoi8 <7,u,1,u>, <7,u,1,u>
-  1544822945U, // <1,u,u,0>: Cost 1 vsldoi4 LHS, LHS
-  1343012966U, // <1,u,u,1>: Cost 1 vspltisw1 LHS
-  2618566248U, // <1,u,u,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
-  2618566806U, // <1,u,u,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
-  1544826166U, // <1,u,u,4>: Cost 1 vsldoi4 LHS, RHS
-  2687154330U, // <1,u,u,5>: Cost 2 vsldoi8 <0,4,1,u>, RHS
-  2756860301U, // <1,u,u,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
-  2284498248U, // <1,u,u,7>: Cost 2 vmrglw <0,4,1,u>, RHS
-  1544828718U, // <1,u,u,u>: Cost 1 vsldoi4 LHS, LHS
-  3300499456U, // <2,0,0,0>: Cost 3 vmrghw <2,0,3,0>, <0,0,0,0>
-  3300499558U, // <2,0,0,1>: Cost 3 vmrghw <2,0,3,0>, LHS
+  2791954748U, // <1,u,7,6>: Cost 3 vsldoi12 <6,7,0,1>, <u,7,6,7>
+  2291789128U, // <1,u,7,7>: Cost 3 vmrglw <1,6,1,7>, RHS
+  1657869960U, // <1,u,7,u>: Cost 2 vsldoi8 <7,u,1,u>, <7,u,1,u>
+  471081121U,  // <1,u,u,0>: Cost 1 vsldoi4 LHS, LHS
+  269271142U,  // <1,u,u,1>: Cost 1 vspltisw1 LHS
+  1544824424U, // <1,u,u,2>: Cost 2 vsldoi4 LHS, <2,2,2,2>
+  1544824982U, // <1,u,u,3>: Cost 2 vsldoi4 LHS, <3,0,1,2>
+  471084342U,  // <1,u,u,4>: Cost 1 vsldoi4 LHS, RHS
+  1613412506U, // <1,u,u,5>: Cost 2 vsldoi8 <0,4,1,u>, RHS
+  1683118477U, // <1,u,u,6>: Cost 2 vsldoi12 <0,u,1,1>, RHS
+  1210756424U, // <1,u,u,7>: Cost 2 vmrglw <0,4,1,u>, RHS
+  471086894U,  // <1,u,u,u>: Cost 1 vsldoi4 LHS, LHS
+  2226757632U, // <2,0,0,0>: Cost 3 vmrghw <2,0,3,0>, <0,0,0,0>
+  2226757734U, // <2,0,0,1>: Cost 3 vmrghw <2,0,3,0>, LHS
   3826622483U, // <2,0,0,2>: Cost 4 vsldoi12 <0,2,1,2>, <0,0,2,1>
   3843211292U, // <2,0,0,3>: Cost 4 vsldoi12 <3,0,1,2>, <0,0,3,1>
   3300499794U, // <2,0,0,4>: Cost 4 vmrghw <2,0,3,0>, <0,4,1,5>
   3356256724U, // <2,0,0,5>: Cost 4 vmrglw <0,1,2,0>, <3,4,0,5>
   3825664056U, // <2,0,0,6>: Cost 4 vsldoi12 <0,0,6,2>, <0,0,6,2>
   3762889289U, // <2,0,0,7>: Cost 4 vsldoi8 <0,7,2,0>, <0,7,2,0>
-  3300500125U, // <2,0,0,u>: Cost 3 vmrghw <2,0,3,0>, LHS
-  3301171210U, // <2,0,1,0>: Cost 3 vmrghw <2,1,3,1>, <0,0,1,1>
-  3301171302U, // <2,0,1,1>: Cost 3 vmrghw <2,1,3,1>, LHS
-  2764898406U, // <2,0,1,2>: Cost 2 vsldoi12 <2,2,2,2>, LHS
-  3740100821U, // <2,0,1,3>: Cost 3 vsldoi4 <u,2,0,1>, <3,0,u,2>
-  3301204306U, // <2,0,1,4>: Cost 3 vmrghw <2,1,3,5>, <0,4,1,5>
+  2226758301U, // <2,0,0,u>: Cost 3 vmrghw <2,0,3,0>, LHS
+  2227429386U, // <2,0,1,0>: Cost 3 vmrghw <2,1,3,1>, <0,0,1,1>
+  2227429478U, // <2,0,1,1>: Cost 3 vmrghw <2,1,3,1>, LHS
+  1691156582U, // <2,0,1,2>: Cost 2 vsldoi12 <2,2,2,2>, LHS
+  2666358997U, // <2,0,1,3>: Cost 3 vsldoi4 <u,2,0,1>, <3,0,u,2>
+  2227462482U, // <2,0,1,4>: Cost 3 vmrghw <2,1,3,5>, <0,4,1,5>
   3722186464U, // <2,0,1,5>: Cost 4 vsldoi4 <5,2,0,1>, <5,2,0,1>
   3867099278U, // <2,0,1,6>: Cost 4 vsldoi12 <7,0,1,2>, <0,1,6,7>
   3366881912U, // <2,0,1,7>: Cost 4 vmrglw <1,u,2,1>, <3,6,0,7>
-  2764898460U, // <2,0,1,u>: Cost 2 vsldoi12 <2,2,2,2>, LHS
-  3301769216U, // <2,0,2,0>: Cost 3 vmrghw <2,2,2,2>, <0,0,0,0>
-  2228027494U, // <2,0,2,1>: Cost 2 vmrghw <2,2,2,2>, LHS
-  3301769389U, // <2,0,2,2>: Cost 3 vmrghw <2,2,2,2>, <0,2,1,2>
+  1691156636U, // <2,0,1,u>: Cost 2 vsldoi12 <2,2,2,2>, LHS
+  2228027392U, // <2,0,2,0>: Cost 3 vmrghw <2,2,2,2>, <0,0,0,0>
+  1154285670U, // <2,0,2,1>: Cost 2 vmrghw <2,2,2,2>, LHS
+  2228027565U, // <2,0,2,2>: Cost 3 vmrghw <2,2,2,2>, <0,2,1,2>
   3301769468U, // <2,0,2,3>: Cost 4 vmrghw <2,2,2,2>, <0,3,1,0>
-  3301769554U, // <2,0,2,4>: Cost 3 vmrghw <2,2,2,2>, <0,4,1,5>
+  2228027730U, // <2,0,2,4>: Cost 3 vmrghw <2,2,2,2>, <0,4,1,5>
   3301769635U, // <2,0,2,5>: Cost 4 vmrghw <2,2,2,2>, <0,5,1,5>
   3780806586U, // <2,0,2,6>: Cost 4 vsldoi8 <3,7,2,0>, <2,6,3,7>
   3368880760U, // <2,0,2,7>: Cost 4 vmrglw <2,2,2,2>, <3,6,0,7>
-  2228028061U, // <2,0,2,u>: Cost 2 vmrghw <2,2,2,2>, LHS
-  2287181824U, // <2,0,3,0>: Cost 2 vmrglw LHS, <0,0,0,0>
-  2287183526U, // <2,0,3,1>: Cost 2 vmrglw LHS, <2,3,0,1>
-  3302277294U, // <2,0,3,2>: Cost 3 vmrghw <2,3,0,1>, <0,2,1,3>
-  3710257456U, // <2,0,3,3>: Cost 3 vsldoi4 <3,2,0,3>, <3,2,0,3>
-  3360924786U, // <2,0,3,4>: Cost 3 vmrglw LHS, <1,5,0,4>
-  3734147170U, // <2,0,3,5>: Cost 3 vsldoi4 <7,2,0,3>, <5,6,7,0>
-  3302277622U, // <2,0,3,6>: Cost 3 vmrghw <2,3,0,1>, <0,6,1,7>
-  3734148244U, // <2,0,3,7>: Cost 3 vsldoi4 <7,2,0,3>, <7,2,0,3>
-  2287183533U, // <2,0,3,u>: Cost 2 vmrglw LHS, <2,3,0,u>
+  1154286237U, // <2,0,2,u>: Cost 2 vmrghw <2,2,2,2>, LHS
+  1213440000U, // <2,0,3,0>: Cost 2 vmrglw LHS, <0,0,0,0>
+  1213441702U, // <2,0,3,1>: Cost 2 vmrglw LHS, <2,3,0,1>
+  2228535470U, // <2,0,3,2>: Cost 3 vmrghw <2,3,0,1>, <0,2,1,3>
+  2636515632U, // <2,0,3,3>: Cost 3 vsldoi4 <3,2,0,3>, <3,2,0,3>
+  2287182962U, // <2,0,3,4>: Cost 3 vmrglw LHS, <1,5,0,4>
+  2660405346U, // <2,0,3,5>: Cost 3 vsldoi4 <7,2,0,3>, <5,6,7,0>
+  2228535798U, // <2,0,3,6>: Cost 3 vmrghw <2,3,0,1>, <0,6,1,7>
+  2660406420U, // <2,0,3,7>: Cost 3 vsldoi4 <7,2,0,3>, <7,2,0,3>
+  1213441709U, // <2,0,3,u>: Cost 2 vmrglw LHS, <2,3,0,u>
   3368894464U, // <2,0,4,0>: Cost 4 vmrglw <2,2,2,4>, <0,0,0,0>
-  3838640466U, // <2,0,4,1>: Cost 3 vsldoi12 <2,2,2,2>, <0,4,1,5>
+  2764898642U, // <2,0,4,1>: Cost 3 vsldoi12 <2,2,2,2>, <0,4,1,5>
   3826622811U, // <2,0,4,2>: Cost 4 vsldoi12 <0,2,1,2>, <0,4,2,5>
   3843211620U, // <2,0,4,3>: Cost 4 vsldoi12 <3,0,1,2>, <0,4,3,5>
   3838640493U, // <2,0,4,4>: Cost 4 vsldoi12 <2,2,2,2>, <0,4,4,5>
-  3806686518U, // <2,0,4,5>: Cost 3 vsldoi8 <u,1,2,0>, RHS
+  2732944694U, // <2,0,4,5>: Cost 3 vsldoi8 <u,1,2,0>, RHS
   3797396857U, // <2,0,4,6>: Cost 4 vsldoi8 <6,5,2,0>, <4,6,5,2>
   3867099528U, // <2,0,4,7>: Cost 4 vsldoi12 <7,0,1,2>, <0,4,7,5>
-  3838640529U, // <2,0,4,u>: Cost 3 vsldoi12 <2,2,2,2>, <0,4,u,5>
+  2764898705U, // <2,0,4,u>: Cost 3 vsldoi12 <2,2,2,2>, <0,4,u,5>
   3364257792U, // <2,0,5,0>: Cost 4 vmrglw <1,4,2,5>, <0,0,0,0>
-  3303866470U, // <2,0,5,1>: Cost 3 vmrghw <2,5,3,6>, LHS
+  2230124646U, // <2,0,5,1>: Cost 3 vmrghw <2,5,3,6>, LHS
   3304235184U, // <2,0,5,2>: Cost 4 vmrghw <2,5,u,6>, <0,2,1,5>
   3364260144U, // <2,0,5,3>: Cost 4 vmrglw <1,4,2,5>, <3,2,0,3>
   3303817554U, // <2,0,5,4>: Cost 4 vmrghw <2,5,3,0>, <0,4,1,5>
   3364260146U, // <2,0,5,5>: Cost 4 vmrglw <1,4,2,5>, <3,2,0,5>
   3867099602U, // <2,0,5,6>: Cost 4 vsldoi12 <7,0,1,2>, <0,5,6,7>
   3364260472U, // <2,0,5,7>: Cost 4 vmrglw <1,4,2,5>, <3,6,0,7>
-  3303867037U, // <2,0,5,u>: Cost 3 vmrghw <2,5,3,6>, LHS
-  3304538112U, // <2,0,6,0>: Cost 3 vmrghw <2,6,3,7>, <0,0,0,0>
-  2230796390U, // <2,0,6,1>: Cost 2 vmrghw <2,6,3,7>, LHS
-  3304538289U, // <2,0,6,2>: Cost 3 vmrghw <2,6,3,7>, <0,2,1,6>
+  2230125213U, // <2,0,5,u>: Cost 3 vmrghw <2,5,3,6>, LHS
+  2230796288U, // <2,0,6,0>: Cost 3 vmrghw <2,6,3,7>, <0,0,0,0>
+  1157054566U, // <2,0,6,1>: Cost 2 vmrghw <2,6,3,7>, LHS
+  2230796465U, // <2,0,6,2>: Cost 3 vmrghw <2,6,3,7>, <0,2,1,6>
   3304538364U, // <2,0,6,3>: Cost 4 vmrghw <2,6,3,7>, <0,3,1,0>
-  3304538450U, // <2,0,6,4>: Cost 3 vmrghw <2,6,3,7>, <0,4,1,5>
+  2230796626U, // <2,0,6,4>: Cost 3 vmrghw <2,6,3,7>, <0,4,1,5>
   3797398205U, // <2,0,6,5>: Cost 4 vsldoi8 <6,5,2,0>, <6,5,2,0>
   3304538614U, // <2,0,6,6>: Cost 4 vmrghw <2,6,3,7>, <0,6,1,7>
   3798725471U, // <2,0,6,7>: Cost 4 vsldoi8 <6,7,2,0>, <6,7,2,0>
-  2230796957U, // <2,0,6,u>: Cost 2 vmrghw <2,6,3,7>, LHS
+  1157055133U, // <2,0,6,u>: Cost 2 vmrghw <2,6,3,7>, LHS
   3371573248U, // <2,0,7,0>: Cost 4 vmrglw <2,6,2,7>, <0,0,0,0>
-  3304931430U, // <2,0,7,1>: Cost 3 vmrghw <2,7,0,1>, LHS
+  2231189606U, // <2,0,7,1>: Cost 3 vmrghw <2,7,0,1>, LHS
   3801380003U, // <2,0,7,2>: Cost 4 vsldoi8 <7,2,2,0>, <7,2,2,0>
   3802043636U, // <2,0,7,3>: Cost 4 vsldoi8 <7,3,2,0>, <7,3,2,0>
   3806688614U, // <2,0,7,4>: Cost 4 vsldoi8 <u,1,2,0>, <7,4,5,6>
   3356317308U, // <2,0,7,5>: Cost 4 vmrglw <0,1,2,7>, <7,u,0,5>
   3804034535U, // <2,0,7,6>: Cost 4 vsldoi8 <7,6,2,0>, <7,6,2,0>
   3806688876U, // <2,0,7,7>: Cost 4 vsldoi8 <u,1,2,0>, <7,7,7,7>
-  3304931997U, // <2,0,7,u>: Cost 3 vmrghw <2,7,0,1>, LHS
-  2282577920U, // <2,0,u,0>: Cost 2 vmrglw LHS, <0,0,0,0>
-  2282579622U, // <2,0,u,1>: Cost 2 vmrglw LHS, <2,3,0,1>
-  2764898973U, // <2,0,u,2>: Cost 2 vsldoi12 <2,2,2,2>, LHS
-  3710298421U, // <2,0,u,3>: Cost 3 vsldoi4 <3,2,0,u>, <3,2,0,u>
-  3356321449U, // <2,0,u,4>: Cost 3 vmrglw LHS, <2,3,0,4>
-  3734188130U, // <2,0,u,5>: Cost 3 vsldoi4 <7,2,0,u>, <5,6,7,0>
-  3302277622U, // <2,0,u,6>: Cost 3 vmrghw <2,3,0,1>, <0,6,1,7>
-  3734189209U, // <2,0,u,7>: Cost 3 vsldoi4 <7,2,0,u>, <7,2,0,u>
-  2282579629U, // <2,0,u,u>: Cost 2 vmrglw LHS, <2,3,0,u>
+  2231190173U, // <2,0,7,u>: Cost 3 vmrghw <2,7,0,1>, LHS
+  1208836096U, // <2,0,u,0>: Cost 2 vmrglw LHS, <0,0,0,0>
+  1208837798U, // <2,0,u,1>: Cost 2 vmrglw LHS, <2,3,0,1>
+  1691157149U, // <2,0,u,2>: Cost 2 vsldoi12 <2,2,2,2>, LHS
+  2636556597U, // <2,0,u,3>: Cost 3 vsldoi4 <3,2,0,u>, <3,2,0,u>
+  2282579625U, // <2,0,u,4>: Cost 3 vmrglw LHS, <2,3,0,4>
+  2660446306U, // <2,0,u,5>: Cost 3 vsldoi4 <7,2,0,u>, <5,6,7,0>
+  2228535798U, // <2,0,u,6>: Cost 3 vmrghw <2,3,0,1>, <0,6,1,7>
+  2660447385U, // <2,0,u,7>: Cost 3 vsldoi4 <7,2,0,u>, <7,2,0,u>
+  1208837805U, // <2,0,u,u>: Cost 2 vmrglw LHS, <2,3,0,u>
   3692388523U, // <2,1,0,0>: Cost 4 vsldoi4 <0,2,1,0>, <0,2,1,0>
-  3831268068U, // <2,1,0,1>: Cost 3 vsldoi12 <1,0,1,2>, <1,0,1,2>
-  3404032798U, // <2,1,0,2>: Cost 3 vmrglw <u,1,2,0>, <3,u,1,2>
+  2757526244U, // <2,1,0,1>: Cost 3 vsldoi12 <1,0,1,2>, <1,0,1,2>
+  2330290974U, // <2,1,0,2>: Cost 3 vmrglw <u,1,2,0>, <3,u,1,2>
   3843212020U, // <2,1,0,3>: Cost 4 vsldoi12 <3,0,1,2>, <1,0,3,0>
   3692391734U, // <2,1,0,4>: Cost 4 vsldoi4 <0,2,1,0>, RHS
   3300533362U, // <2,1,0,5>: Cost 4 vmrghw <2,0,3,4>, <1,5,0,4>
   3794084337U, // <2,1,0,6>: Cost 4 vsldoi8 <6,0,2,1>, <0,6,1,2>
   3374170614U, // <2,1,0,7>: Cost 5 vmrglw <3,1,2,0>, <0,6,1,7>
-  3831784227U, // <2,1,0,u>: Cost 3 vsldoi12 <1,0,u,2>, <1,0,u,2>
-  3764224748U, // <2,1,1,0>: Cost 3 vsldoi8 <1,0,2,1>, <1,0,2,1>
-  3838640948U, // <2,1,1,1>: Cost 3 vsldoi12 <2,2,2,2>, <1,1,1,1>
-  3769533334U, // <2,1,1,2>: Cost 3 vsldoi8 <1,u,2,1>, <1,2,3,0>
+  2758042403U, // <2,1,0,u>: Cost 3 vsldoi12 <1,0,u,2>, <1,0,u,2>
+  2690482924U, // <2,1,1,0>: Cost 3 vsldoi8 <1,0,2,1>, <1,0,2,1>
+  2764899124U, // <2,1,1,1>: Cost 3 vsldoi12 <2,2,2,2>, <1,1,1,1>
+  2695791510U, // <2,1,1,2>: Cost 3 vsldoi8 <1,u,2,1>, <1,2,3,0>
   3362235271U, // <2,1,1,3>: Cost 4 vmrglw <1,1,2,1>, <1,2,1,3>
   3692399926U, // <2,1,1,4>: Cost 4 vsldoi4 <0,2,1,1>, RHS
   3832226649U, // <2,1,1,5>: Cost 4 vsldoi12 <1,1,5,2>, <1,1,5,2>
   3301205235U, // <2,1,1,6>: Cost 4 vmrghw <2,1,3,5>, <1,6,5,7>
   3768870179U, // <2,1,1,7>: Cost 4 vsldoi8 <1,7,2,1>, <1,7,2,1>
-  3769533812U, // <2,1,1,u>: Cost 3 vsldoi8 <1,u,2,1>, <1,u,2,1>
-  3692404909U, // <2,1,2,0>: Cost 3 vsldoi4 <0,2,1,2>, <0,2,1,2>
-  3301770036U, // <2,1,2,1>: Cost 3 vmrghw <2,2,2,2>, <1,1,1,1>
-  3692406376U, // <2,1,2,2>: Cost 3 vsldoi4 <0,2,1,2>, <2,2,2,2>
-  3832742808U, // <2,1,2,3>: Cost 3 vsldoi12 <1,2,3,2>, <1,2,3,2>
-  3692408118U, // <2,1,2,4>: Cost 3 vsldoi4 <0,2,1,2>, RHS
-  3368878418U, // <2,1,2,5>: Cost 3 vmrglw <2,2,2,2>, <0,4,1,5>
+  2695791988U, // <2,1,1,u>: Cost 3 vsldoi8 <1,u,2,1>, <1,u,2,1>
+  2618663085U, // <2,1,2,0>: Cost 3 vsldoi4 <0,2,1,2>, <0,2,1,2>
+  2228028212U, // <2,1,2,1>: Cost 3 vmrghw <2,2,2,2>, <1,1,1,1>
+  2618664552U, // <2,1,2,2>: Cost 3 vsldoi4 <0,2,1,2>, <2,2,2,2>
+  2759000984U, // <2,1,2,3>: Cost 3 vsldoi12 <1,2,3,2>, <1,2,3,2>
+  2618666294U, // <2,1,2,4>: Cost 3 vsldoi4 <0,2,1,2>, RHS
+  2295136594U, // <2,1,2,5>: Cost 3 vmrglw <2,2,2,2>, <0,4,1,5>
   3769534376U, // <2,1,2,6>: Cost 4 vsldoi8 <1,u,2,1>, <2,6,1,7>
-  3867100090U, // <2,1,2,7>: Cost 3 vsldoi12 <7,0,1,2>, <1,2,7,0>
-  3692410670U, // <2,1,2,u>: Cost 3 vsldoi4 <0,2,1,2>, LHS
-  3356278793U, // <2,1,3,0>: Cost 3 vmrglw LHS, <0,0,1,0>
-  2282536970U, // <2,1,3,1>: Cost 2 vmrglw LHS, <0,0,1,1>
-  2287184022U, // <2,1,3,2>: Cost 2 vmrglw LHS, <3,0,1,2>
-  3360923822U, // <2,1,3,3>: Cost 3 vmrglw LHS, <0,2,1,3>
-  3692416310U, // <2,1,3,4>: Cost 3 vsldoi4 <0,2,1,3>, RHS
-  2282537298U, // <2,1,3,5>: Cost 2 vmrglw LHS, <0,4,1,5>
-  3360923825U, // <2,1,3,6>: Cost 3 vmrglw LHS, <0,2,1,6>
-  3360924879U, // <2,1,3,7>: Cost 3 vmrglw LHS, <1,6,1,7>
-  2282536977U, // <2,1,3,u>: Cost 2 vmrglw LHS, <0,0,1,u>
+  2793358266U, // <2,1,2,7>: Cost 3 vsldoi12 <7,0,1,2>, <1,2,7,0>
+  2618668846U, // <2,1,2,u>: Cost 3 vsldoi4 <0,2,1,2>, LHS
+  2282536969U, // <2,1,3,0>: Cost 3 vmrglw LHS, <0,0,1,0>
+  1208795146U, // <2,1,3,1>: Cost 2 vmrglw LHS, <0,0,1,1>
+  1213442198U, // <2,1,3,2>: Cost 2 vmrglw LHS, <3,0,1,2>
+  2287181998U, // <2,1,3,3>: Cost 3 vmrglw LHS, <0,2,1,3>
+  2618674486U, // <2,1,3,4>: Cost 3 vsldoi4 <0,2,1,3>, RHS
+  1208795474U, // <2,1,3,5>: Cost 2 vmrglw LHS, <0,4,1,5>
+  2287182001U, // <2,1,3,6>: Cost 3 vmrglw LHS, <0,2,1,6>
+  2287183055U, // <2,1,3,7>: Cost 3 vmrglw LHS, <1,6,1,7>
+  1208795153U, // <2,1,3,u>: Cost 2 vmrglw LHS, <0,0,1,u>
   3692421295U, // <2,1,4,0>: Cost 4 vsldoi4 <0,2,1,4>, <0,2,1,4>
   3838641195U, // <2,1,4,1>: Cost 4 vsldoi12 <2,2,2,2>, <1,4,1,5>
-  3404065566U, // <2,1,4,2>: Cost 3 vmrglw <u,1,2,4>, <3,u,1,2>
+  2330323742U, // <2,1,4,2>: Cost 3 vmrglw <u,1,2,4>, <3,u,1,2>
   3692423318U, // <2,1,4,3>: Cost 5 vsldoi4 <0,2,1,4>, <3,0,1,2>
   3692424502U, // <2,1,4,4>: Cost 4 vsldoi4 <0,2,1,4>, RHS
-  3769535798U, // <2,1,4,5>: Cost 3 vsldoi8 <1,u,2,1>, RHS
+  2695793974U, // <2,1,4,5>: Cost 3 vsldoi8 <1,u,2,1>, RHS
   3799395705U, // <2,1,4,6>: Cost 4 vsldoi8 <6,u,2,1>, <4,6,5,2>
   3368895695U, // <2,1,4,7>: Cost 5 vmrglw <2,2,2,4>, <1,6,1,7>
-  3769536041U, // <2,1,4,u>: Cost 3 vsldoi8 <1,u,2,1>, RHS
+  2695794217U, // <2,1,4,u>: Cost 3 vsldoi8 <1,u,2,1>, RHS
   3692429488U, // <2,1,5,0>: Cost 4 vsldoi4 <0,2,1,5>, <0,2,1,5>
   3364257802U, // <2,1,5,1>: Cost 4 vmrglw <1,4,2,5>, <0,0,1,1>
   3692431253U, // <2,1,5,2>: Cost 4 vsldoi4 <0,2,1,5>, <2,5,u,6>
@@ -1614,339 +1614,339 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3303875827U, // <2,1,5,6>: Cost 4 vmrghw <2,5,3,7>, <1,6,5,7>
   3867100333U, // <2,1,5,7>: Cost 4 vsldoi12 <7,0,1,2>, <1,5,7,0>
   3692435246U, // <2,1,5,u>: Cost 4 vsldoi4 <0,2,1,5>, LHS
-  3692437681U, // <2,1,6,0>: Cost 3 vsldoi4 <0,2,1,6>, <0,2,1,6>
-  3304538932U, // <2,1,6,1>: Cost 3 vmrghw <2,6,3,7>, <1,1,1,1>
-  3692439482U, // <2,1,6,2>: Cost 3 vsldoi4 <0,2,1,6>, <2,6,3,7>
+  2618695857U, // <2,1,6,0>: Cost 3 vsldoi4 <0,2,1,6>, <0,2,1,6>
+  2230797108U, // <2,1,6,1>: Cost 3 vmrghw <2,6,3,7>, <1,1,1,1>
+  2618697658U, // <2,1,6,2>: Cost 3 vsldoi4 <0,2,1,6>, <2,6,3,7>
   3692439702U, // <2,1,6,3>: Cost 4 vsldoi4 <0,2,1,6>, <3,0,1,2>
-  3692440886U, // <2,1,6,4>: Cost 3 vsldoi4 <0,2,1,6>, RHS
+  2618699062U, // <2,1,6,4>: Cost 3 vsldoi4 <0,2,1,6>, RHS
   3364929874U, // <2,1,6,5>: Cost 4 vmrglw <1,5,2,6>, <0,4,1,5>
   3692442424U, // <2,1,6,6>: Cost 4 vsldoi4 <0,2,1,6>, <6,6,6,6>
   3798733664U, // <2,1,6,7>: Cost 4 vsldoi8 <6,7,2,1>, <6,7,2,1>
-  3692443438U, // <2,1,6,u>: Cost 3 vsldoi4 <0,2,1,6>, LHS
+  2618701614U, // <2,1,6,u>: Cost 3 vsldoi4 <0,2,1,6>, LHS
   3799397370U, // <2,1,7,0>: Cost 4 vsldoi8 <6,u,2,1>, <7,0,1,2>
   3371573258U, // <2,1,7,1>: Cost 4 vmrglw <2,6,2,7>, <0,0,1,1>
-  3404093058U, // <2,1,7,2>: Cost 3 vmrglw <u,1,2,7>, <7,u,1,2>
+  2330351234U, // <2,1,7,2>: Cost 3 vmrglw <u,1,2,7>, <7,u,1,2>
   3799397658U, // <2,1,7,3>: Cost 4 vsldoi8 <6,u,2,1>, <7,3,6,2>
   3799397734U, // <2,1,7,4>: Cost 4 vsldoi8 <6,u,2,1>, <7,4,5,6>
   3371573586U, // <2,1,7,5>: Cost 4 vmrglw <2,6,2,7>, <0,4,1,5>
   3799397870U, // <2,1,7,6>: Cost 4 vsldoi8 <6,u,2,1>, <7,6,2,7>
   3799397956U, // <2,1,7,7>: Cost 4 vsldoi8 <6,u,2,1>, <7,7,3,3>
-  3404093058U, // <2,1,7,u>: Cost 3 vmrglw <u,1,2,7>, <7,u,1,2>
-  3356319753U, // <2,1,u,0>: Cost 3 vmrglw LHS, <0,0,1,0>
-  2282577930U, // <2,1,u,1>: Cost 2 vmrglw LHS, <0,0,1,1>
-  2282580118U, // <2,1,u,2>: Cost 2 vmrglw LHS, <3,0,1,2>
-  3356319918U, // <2,1,u,3>: Cost 3 vmrglw LHS, <0,2,1,3>
-  3356319757U, // <2,1,u,4>: Cost 3 vmrglw LHS, <0,0,1,4>
-  2282578258U, // <2,1,u,5>: Cost 2 vmrglw LHS, <0,4,1,5>
-  3356319921U, // <2,1,u,6>: Cost 3 vmrglw LHS, <0,2,1,6>
-  3360965839U, // <2,1,u,7>: Cost 3 vmrglw LHS, <1,6,1,7>
-  2282577937U, // <2,1,u,u>: Cost 2 vmrglw LHS, <0,0,1,u>
-  3300500941U, // <2,2,0,0>: Cost 3 vmrghw <2,0,3,0>, <2,0,3,0>
-  2697789542U, // <2,2,0,1>: Cost 2 vsldoi8 <2,2,2,2>, LHS
-  3771531437U, // <2,2,0,2>: Cost 3 vsldoi8 <2,2,2,2>, <0,2,1,2>
-  3300509350U, // <2,2,0,3>: Cost 3 vmrghw <2,0,3,1>, <2,3,0,1>
-  3771531602U, // <2,2,0,4>: Cost 3 vsldoi8 <2,2,2,2>, <0,4,1,5>
+  2330351234U, // <2,1,7,u>: Cost 3 vmrglw <u,1,2,7>, <7,u,1,2>
+  2282577929U, // <2,1,u,0>: Cost 3 vmrglw LHS, <0,0,1,0>
+  1208836106U, // <2,1,u,1>: Cost 2 vmrglw LHS, <0,0,1,1>
+  1208838294U, // <2,1,u,2>: Cost 2 vmrglw LHS, <3,0,1,2>
+  2282578094U, // <2,1,u,3>: Cost 3 vmrglw LHS, <0,2,1,3>
+  2282577933U, // <2,1,u,4>: Cost 3 vmrglw LHS, <0,0,1,4>
+  1208836434U, // <2,1,u,5>: Cost 2 vmrglw LHS, <0,4,1,5>
+  2282578097U, // <2,1,u,6>: Cost 3 vmrglw LHS, <0,2,1,6>
+  2287224015U, // <2,1,u,7>: Cost 3 vmrglw LHS, <1,6,1,7>
+  1208836113U, // <2,1,u,u>: Cost 2 vmrglw LHS, <0,0,1,u>
+  2226759117U, // <2,2,0,0>: Cost 3 vmrghw <2,0,3,0>, <2,0,3,0>
+  1624047718U, // <2,2,0,1>: Cost 2 vsldoi8 <2,2,2,2>, LHS
+  2697789613U, // <2,2,0,2>: Cost 3 vsldoi8 <2,2,2,2>, <0,2,1,2>
+  2226767526U, // <2,2,0,3>: Cost 3 vmrghw <2,0,3,1>, <2,3,0,1>
+  2697789778U, // <2,2,0,4>: Cost 3 vsldoi8 <2,2,2,2>, <0,4,1,5>
   3300657000U, // <2,2,0,5>: Cost 4 vmrghw <2,0,5,1>, <2,5,3,6>
-  3300730810U, // <2,2,0,6>: Cost 3 vmrghw <2,0,6,1>, <2,6,3,7>
+  2226988986U, // <2,2,0,6>: Cost 3 vmrghw <2,0,6,1>, <2,6,3,7>
   3734271139U, // <2,2,0,7>: Cost 4 vsldoi4 <7,2,2,0>, <7,2,2,0>
-  2697790109U, // <2,2,0,u>: Cost 2 vsldoi8 <2,2,2,2>, LHS
+  1624048285U, // <2,2,0,u>: Cost 2 vsldoi8 <2,2,2,2>, LHS
   3831268868U, // <2,2,1,0>: Cost 4 vsldoi12 <1,0,1,2>, <2,1,0,1>
-  3366880628U, // <2,2,1,1>: Cost 3 vmrglw <1,u,2,1>, <1,u,2,1>
-  3771532182U, // <2,2,1,2>: Cost 3 vsldoi8 <2,2,2,2>, <1,2,3,0>
-  3366879334U, // <2,2,1,3>: Cost 3 vmrglw <1,u,2,1>, LHS
+  2293138804U, // <2,2,1,1>: Cost 3 vmrglw <1,u,2,1>, <1,u,2,1>
+  2697790358U, // <2,2,1,2>: Cost 3 vsldoi8 <2,2,2,2>, <1,2,3,0>
+  2293137510U, // <2,2,1,3>: Cost 3 vmrglw <1,u,2,1>, LHS
   3771532331U, // <2,2,1,4>: Cost 4 vsldoi8 <2,2,2,2>, <1,4,1,5>
   3767551106U, // <2,2,1,5>: Cost 4 vsldoi8 <1,5,2,2>, <1,5,2,2>
   3301173178U, // <2,2,1,6>: Cost 4 vmrghw <2,1,3,1>, <2,6,3,7>
   3372853169U, // <2,2,1,7>: Cost 4 vmrglw <2,u,2,1>, <2,6,2,7>
-  3366879339U, // <2,2,1,u>: Cost 3 vmrglw <1,u,2,1>, LHS
-  2630680678U, // <2,2,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
-  3368879557U, // <2,2,2,1>: Cost 3 vmrglw <2,2,2,2>, <2,0,2,1>
-  1410121830U, // <2,2,2,2>: Cost 1 vspltisw2 LHS
-  2295136358U, // <2,2,2,3>: Cost 2 vmrglw <2,2,2,2>, LHS
-  2630683958U, // <2,2,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
-  3368879885U, // <2,2,2,5>: Cost 3 vmrglw <2,2,2,2>, <2,4,2,5>
-  3301771194U, // <2,2,2,6>: Cost 3 vmrghw <2,2,2,2>, <2,6,3,7>
-  3734287525U, // <2,2,2,7>: Cost 3 vsldoi4 <7,2,2,2>, <7,2,2,2>
-  1410121830U, // <2,2,2,u>: Cost 1 vspltisw2 LHS
-  3771533462U, // <2,2,3,0>: Cost 3 vsldoi8 <2,2,2,2>, <3,0,1,2>
-  3839231664U, // <2,2,3,1>: Cost 3 vsldoi12 <2,3,1,2>, <2,3,1,2>
-  2287183464U, // <2,2,3,2>: Cost 2 vmrglw LHS, <2,2,2,2>
-  1208795238U, // <2,2,3,3>: Cost 1 vmrglw LHS, LHS
-  3771533826U, // <2,2,3,4>: Cost 3 vsldoi8 <2,2,2,2>, <3,4,5,6>
-  3404055604U, // <2,2,3,5>: Cost 3 vmrglw LHS, <1,4,2,5>
-  3360925373U, // <2,2,3,6>: Cost 3 vmrglw LHS, <2,3,2,6>
-  3734295718U, // <2,2,3,7>: Cost 3 vsldoi4 <7,2,2,3>, <7,2,2,3>
-  1208795243U, // <2,2,3,u>: Cost 1 vmrglw LHS, LHS
-  3704438886U, // <2,2,4,0>: Cost 3 vsldoi4 <2,2,2,4>, LHS
+  2293137515U, // <2,2,1,u>: Cost 3 vmrglw <1,u,2,1>, LHS
+  1556938854U, // <2,2,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
+  2295137733U, // <2,2,2,1>: Cost 3 vmrglw <2,2,2,2>, <2,0,2,1>
+  336380006U,  // <2,2,2,2>: Cost 1 vspltisw2 LHS
+  1221394534U, // <2,2,2,3>: Cost 2 vmrglw <2,2,2,2>, LHS
+  1556942134U, // <2,2,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
+  2295138061U, // <2,2,2,5>: Cost 3 vmrglw <2,2,2,2>, <2,4,2,5>
+  2228029370U, // <2,2,2,6>: Cost 3 vmrghw <2,2,2,2>, <2,6,3,7>
+  2660545701U, // <2,2,2,7>: Cost 3 vsldoi4 <7,2,2,2>, <7,2,2,2>
+  336380006U,  // <2,2,2,u>: Cost 1 vspltisw2 LHS
+  2697791638U, // <2,2,3,0>: Cost 3 vsldoi8 <2,2,2,2>, <3,0,1,2>
+  2765489840U, // <2,2,3,1>: Cost 3 vsldoi12 <2,3,1,2>, <2,3,1,2>
+  1213441640U, // <2,2,3,2>: Cost 2 vmrglw LHS, <2,2,2,2>
+  135053414U,  // <2,2,3,3>: Cost 1 vmrglw LHS, LHS
+  2697792002U, // <2,2,3,4>: Cost 3 vsldoi8 <2,2,2,2>, <3,4,5,6>
+  2330313780U, // <2,2,3,5>: Cost 3 vmrglw LHS, <1,4,2,5>
+  2287183549U, // <2,2,3,6>: Cost 3 vmrglw LHS, <2,3,2,6>
+  2660553894U, // <2,2,3,7>: Cost 3 vsldoi4 <7,2,2,3>, <7,2,2,3>
+  135053419U,  // <2,2,3,u>: Cost 1 vmrglw LHS, LHS
+  2630697062U, // <2,2,4,0>: Cost 3 vsldoi4 <2,2,2,4>, LHS
   3771534282U, // <2,2,4,1>: Cost 4 vsldoi8 <2,2,2,2>, <4,1,2,3>
-  3838641933U, // <2,2,4,2>: Cost 3 vsldoi12 <2,2,2,2>, <2,4,2,5>
-  3368894566U, // <2,2,4,3>: Cost 3 vmrglw <2,2,2,4>, LHS
-  3368896106U, // <2,2,4,4>: Cost 3 vmrglw <2,2,2,4>, <2,2,2,4>
-  2697792822U, // <2,2,4,5>: Cost 2 vsldoi8 <2,2,2,2>, RHS
-  3303417786U, // <2,2,4,6>: Cost 3 vmrghw <2,4,6,5>, <2,6,3,7>
+  2764900109U, // <2,2,4,2>: Cost 3 vsldoi12 <2,2,2,2>, <2,4,2,5>
+  2295152742U, // <2,2,4,3>: Cost 3 vmrglw <2,2,2,4>, LHS
+  2295154282U, // <2,2,4,4>: Cost 3 vmrglw <2,2,2,4>, <2,2,2,4>
+  1624050998U, // <2,2,4,5>: Cost 2 vsldoi8 <2,2,2,2>, RHS
+  2229675962U, // <2,2,4,6>: Cost 3 vmrghw <2,4,6,5>, <2,6,3,7>
   3368896433U, // <2,2,4,7>: Cost 4 vmrglw <2,2,2,4>, <2,6,2,7>
-  2697793065U, // <2,2,4,u>: Cost 2 vsldoi8 <2,2,2,2>, RHS
+  1624051241U, // <2,2,4,u>: Cost 2 vsldoi8 <2,2,2,2>, RHS
   3771534920U, // <2,2,5,0>: Cost 4 vsldoi8 <2,2,2,2>, <5,0,1,2>
   3364258540U, // <2,2,5,1>: Cost 4 vmrglw <1,4,2,5>, <1,0,2,1>
-  3370231400U, // <2,2,5,2>: Cost 3 vmrglw <2,4,2,5>, <2,2,2,2>
-  3364257894U, // <2,2,5,3>: Cost 3 vmrglw <1,4,2,5>, LHS
+  2296489576U, // <2,2,5,2>: Cost 3 vmrglw <2,4,2,5>, <2,2,2,2>
+  2290516070U, // <2,2,5,3>: Cost 3 vmrglw <1,4,2,5>, LHS
   3771535284U, // <2,2,5,4>: Cost 4 vsldoi8 <2,2,2,2>, <5,4,5,6>
-  3364258868U, // <2,2,5,5>: Cost 3 vmrglw <1,4,2,5>, <1,4,2,5>
-  3771535458U, // <2,2,5,6>: Cost 3 vsldoi8 <2,2,2,2>, <5,6,7,0>
+  2290517044U, // <2,2,5,5>: Cost 3 vmrglw <1,4,2,5>, <1,4,2,5>
+  2697793634U, // <2,2,5,6>: Cost 3 vsldoi8 <2,2,2,2>, <5,6,7,0>
   3370231729U, // <2,2,5,7>: Cost 4 vmrglw <2,4,2,5>, <2,6,2,7>
-  3364257899U, // <2,2,5,u>: Cost 3 vmrglw <1,4,2,5>, LHS
-  3304539625U, // <2,2,6,0>: Cost 3 vmrghw <2,6,3,7>, <2,0,6,1>
+  2290516075U, // <2,2,5,u>: Cost 3 vmrglw <1,4,2,5>, LHS
+  2230797801U, // <2,2,6,0>: Cost 3 vmrghw <2,6,3,7>, <2,0,6,1>
   3304539679U, // <2,2,6,1>: Cost 4 vmrghw <2,6,3,7>, <2,1,3,1>
-  3838642097U, // <2,2,6,2>: Cost 3 vsldoi12 <2,2,2,2>, <2,6,2,7>
-  3838642106U, // <2,2,6,3>: Cost 3 vsldoi12 <2,2,2,2>, <2,6,3,7>
-  3304539953U, // <2,2,6,4>: Cost 3 vmrghw <2,6,3,7>, <2,4,6,5>
+  2764900273U, // <2,2,6,2>: Cost 3 vsldoi12 <2,2,2,2>, <2,6,2,7>
+  2764900282U, // <2,2,6,3>: Cost 3 vsldoi12 <2,2,2,2>, <2,6,3,7>
+  2230798129U, // <2,2,6,4>: Cost 3 vmrghw <2,6,3,7>, <2,4,6,5>
   3304540008U, // <2,2,6,5>: Cost 4 vmrghw <2,6,3,7>, <2,5,3,6>
-  2230798266U, // <2,2,6,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
-  3798741857U, // <2,2,6,7>: Cost 3 vsldoi8 <6,7,2,2>, <6,7,2,2>
-  2230798266U, // <2,2,6,u>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
-  3867101162U, // <2,2,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <2,7,0,1>
+  1157056442U, // <2,2,6,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
+  2725000033U, // <2,2,6,7>: Cost 3 vsldoi8 <6,7,2,2>, <6,7,2,2>
+  1157056442U, // <2,2,6,u>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
+  2793359338U, // <2,2,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <2,7,0,1>
   3371574725U, // <2,2,7,1>: Cost 4 vmrglw <2,6,2,7>, <2,0,2,1>
-  3371574888U, // <2,2,7,2>: Cost 3 vmrglw <2,6,2,7>, <2,2,2,2>
-  3371573350U, // <2,2,7,3>: Cost 3 vmrglw <2,6,2,7>, LHS
-  3771536742U, // <2,2,7,4>: Cost 3 vsldoi8 <2,2,2,2>, <7,4,5,6>
+  2297833064U, // <2,2,7,2>: Cost 3 vmrglw <2,6,2,7>, <2,2,2,2>
+  2297831526U, // <2,2,7,3>: Cost 3 vmrglw <2,6,2,7>, LHS
+  2697794918U, // <2,2,7,4>: Cost 3 vsldoi8 <2,2,2,2>, <7,4,5,6>
   3371575053U, // <2,2,7,5>: Cost 4 vmrglw <2,6,2,7>, <2,4,2,5>
   3304933297U, // <2,2,7,6>: Cost 4 vmrghw <2,7,0,1>, <2,6,2,7>
-  3371575217U, // <2,2,7,7>: Cost 3 vmrglw <2,6,2,7>, <2,6,2,7>
-  3371573355U, // <2,2,7,u>: Cost 3 vmrglw <2,6,2,7>, LHS
-  2630680678U, // <2,2,u,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
-  2697795374U, // <2,2,u,1>: Cost 2 vsldoi8 <2,2,2,2>, LHS
-  1410121830U, // <2,2,u,2>: Cost 1 vspltisw2 LHS
-  1208836198U, // <2,2,u,3>: Cost 1 vmrglw LHS, LHS
-  2630683958U, // <2,2,u,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
-  2697795738U, // <2,2,u,5>: Cost 2 vsldoi8 <2,2,2,2>, RHS
-  2230798266U, // <2,2,u,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
-  3734336683U, // <2,2,u,7>: Cost 3 vsldoi4 <7,2,2,u>, <7,2,2,u>
-  1208836203U, // <2,2,u,u>: Cost 1 vmrglw LHS, LHS
-  2685190144U, // <2,3,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
-  1611448422U, // <2,3,0,1>: Cost 1 vsldoi8 LHS, LHS
-  3763577005U, // <2,3,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
-  3763577084U, // <2,3,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
-  2685190482U, // <2,3,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
-  3806708178U, // <2,3,0,5>: Cost 3 vsldoi8 LHS, <0,5,6,7>
-  3806708214U, // <2,3,0,6>: Cost 3 vsldoi8 LHS, <0,6,1,7>
-  3734344876U, // <2,3,0,7>: Cost 3 vsldoi4 <7,2,3,0>, <7,2,3,0>
-  1611448989U, // <2,3,0,u>: Cost 1 vsldoi8 LHS, LHS
-  3763577572U, // <2,3,1,0>: Cost 3 vsldoi8 LHS, <1,0,1,2>
-  2685190964U, // <2,3,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
-  2685191062U, // <2,3,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
+  2297833393U, // <2,2,7,7>: Cost 3 vmrglw <2,6,2,7>, <2,6,2,7>
+  2297831531U, // <2,2,7,u>: Cost 3 vmrglw <2,6,2,7>, LHS
+  1556938854U, // <2,2,u,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
+  1624053550U, // <2,2,u,1>: Cost 2 vsldoi8 <2,2,2,2>, LHS
+  336380006U,  // <2,2,u,2>: Cost 1 vspltisw2 LHS
+  135094374U,  // <2,2,u,3>: Cost 1 vmrglw LHS, LHS
+  1556942134U, // <2,2,u,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
+  1624053914U, // <2,2,u,5>: Cost 2 vsldoi8 <2,2,2,2>, RHS
+  1157056442U, // <2,2,u,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
+  2660594859U, // <2,2,u,7>: Cost 3 vsldoi4 <7,2,2,u>, <7,2,2,u>
+  135094379U,  // <2,2,u,u>: Cost 1 vmrglw LHS, LHS
+  1611448320U, // <2,3,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
+  537706598U,  // <2,3,0,1>: Cost 1 vsldoi8 LHS, LHS
+  2689835181U, // <2,3,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
+  2689835260U, // <2,3,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
+  1611448658U, // <2,3,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
+  2732966354U, // <2,3,0,5>: Cost 3 vsldoi8 LHS, <0,5,6,7>
+  2732966390U, // <2,3,0,6>: Cost 3 vsldoi8 LHS, <0,6,1,7>
+  2660603052U, // <2,3,0,7>: Cost 3 vsldoi4 <7,2,3,0>, <7,2,3,0>
+  537707165U,  // <2,3,0,u>: Cost 1 vsldoi8 LHS, LHS
+  2689835748U, // <2,3,1,0>: Cost 3 vsldoi8 LHS, <1,0,1,2>
+  1611449140U, // <2,3,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
+  1611449238U, // <2,3,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
   3763577805U, // <2,3,1,3>: Cost 4 vsldoi8 LHS, <1,3,0,1>
-  3763577936U, // <2,3,1,4>: Cost 3 vsldoi8 LHS, <1,4,5,6>
-  3763577967U, // <2,3,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
-  3763578063U, // <2,3,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
+  2689836112U, // <2,3,1,4>: Cost 3 vsldoi8 LHS, <1,4,5,6>
+  2689836143U, // <2,3,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
+  2689836239U, // <2,3,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
   3366881210U, // <2,3,1,7>: Cost 4 vmrglw <1,u,2,1>, <2,6,3,7>
-  2689836412U, // <2,3,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
-  3763578317U, // <2,3,2,0>: Cost 3 vsldoi8 LHS, <2,0,3,0>
-  3758933535U, // <2,3,2,1>: Cost 3 vsldoi8 LHS, <2,1,3,1>
-  2685191784U, // <2,3,2,2>: Cost 2 vsldoi8 LHS, <2,2,2,2>
-  2685191846U, // <2,3,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
-  3763578646U, // <2,3,2,4>: Cost 3 vsldoi8 LHS, <2,4,3,5>
-  3763578728U, // <2,3,2,5>: Cost 3 vsldoi8 LHS, <2,5,3,6>
-  2685192122U, // <2,3,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
-  3368880058U, // <2,3,2,7>: Cost 3 vmrglw <2,2,2,2>, <2,6,3,7>
-  2685192280U, // <2,3,2,u>: Cost 2 vsldoi8 LHS, <2,u,3,3>
-  2287182742U, // <2,3,3,0>: Cost 2 vmrglw LHS, <1,2,3,0>
-  3356280351U, // <2,3,3,1>: Cost 3 vmrglw LHS, <2,1,3,1>
-  2630764146U, // <2,3,3,2>: Cost 2 vsldoi4 <2,2,3,3>, <2,2,3,3>
-  2282538610U, // <2,3,3,3>: Cost 2 vmrglw LHS, <2,2,3,3>
-  2287182746U, // <2,3,3,4>: Cost 2 vmrglw LHS, <1,2,3,4>
-  3356280355U, // <2,3,3,5>: Cost 3 vmrglw LHS, <2,1,3,5>
-  3360929918U, // <2,3,3,6>: Cost 3 vmrglw LHS, <u,5,3,6>
-  2287183802U, // <2,3,3,7>: Cost 2 vmrglw LHS, <2,6,3,7>
-  2282538615U, // <2,3,3,u>: Cost 2 vmrglw LHS, <2,2,3,u>
-  2624798822U, // <2,3,4,0>: Cost 2 vsldoi4 <1,2,3,4>, LHS
-  2624799642U, // <2,3,4,1>: Cost 2 vsldoi4 <1,2,3,4>, <1,2,3,4>
-  3698542184U, // <2,3,4,2>: Cost 3 vsldoi4 <1,2,3,4>, <2,2,2,2>
-  3698542742U, // <2,3,4,3>: Cost 3 vsldoi4 <1,2,3,4>, <3,0,1,2>
-  2624802102U, // <2,3,4,4>: Cost 2 vsldoi4 <1,2,3,4>, RHS
-  1611451702U, // <2,3,4,5>: Cost 1 vsldoi8 LHS, RHS
-  3806711161U, // <2,3,4,6>: Cost 3 vsldoi8 LHS, <4,6,5,2>
-  3734377648U, // <2,3,4,7>: Cost 3 vsldoi4 <7,2,3,4>, <7,2,3,4>
-  1611451945U, // <2,3,4,u>: Cost 1 vsldoi8 LHS, RHS
-  3763580488U, // <2,3,5,0>: Cost 3 vsldoi8 LHS, <5,0,1,2>
-  3806711439U, // <2,3,5,1>: Cost 3 vsldoi8 LHS, <5,1,0,1>
-  3806711531U, // <2,3,5,2>: Cost 3 vsldoi8 LHS, <5,2,1,3>
+  1616094588U, // <2,3,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
+  2689836493U, // <2,3,2,0>: Cost 3 vsldoi8 LHS, <2,0,3,0>
+  2685191711U, // <2,3,2,1>: Cost 3 vsldoi8 LHS, <2,1,3,1>
+  1611449960U, // <2,3,2,2>: Cost 2 vsldoi8 LHS, <2,2,2,2>
+  1611450022U, // <2,3,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
+  2689836822U, // <2,3,2,4>: Cost 3 vsldoi8 LHS, <2,4,3,5>
+  2689836904U, // <2,3,2,5>: Cost 3 vsldoi8 LHS, <2,5,3,6>
+  1611450298U, // <2,3,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
+  2295138234U, // <2,3,2,7>: Cost 3 vmrglw <2,2,2,2>, <2,6,3,7>
+  1611450456U, // <2,3,2,u>: Cost 2 vsldoi8 LHS, <2,u,3,3>
+  1213440918U, // <2,3,3,0>: Cost 2 vmrglw LHS, <1,2,3,0>
+  2282538527U, // <2,3,3,1>: Cost 3 vmrglw LHS, <2,1,3,1>
+  1557022322U, // <2,3,3,2>: Cost 2 vsldoi4 <2,2,3,3>, <2,2,3,3>
+  1208796786U, // <2,3,3,3>: Cost 2 vmrglw LHS, <2,2,3,3>
+  1213440922U, // <2,3,3,4>: Cost 2 vmrglw LHS, <1,2,3,4>
+  2282538531U, // <2,3,3,5>: Cost 3 vmrglw LHS, <2,1,3,5>
+  2287188094U, // <2,3,3,6>: Cost 3 vmrglw LHS, <u,5,3,6>
+  1213441978U, // <2,3,3,7>: Cost 2 vmrglw LHS, <2,6,3,7>
+  1208796791U, // <2,3,3,u>: Cost 2 vmrglw LHS, <2,2,3,u>
+  1551056998U, // <2,3,4,0>: Cost 2 vsldoi4 <1,2,3,4>, LHS
+  1551057818U, // <2,3,4,1>: Cost 2 vsldoi4 <1,2,3,4>, <1,2,3,4>
+  2624800360U, // <2,3,4,2>: Cost 3 vsldoi4 <1,2,3,4>, <2,2,2,2>
+  2624800918U, // <2,3,4,3>: Cost 3 vsldoi4 <1,2,3,4>, <3,0,1,2>
+  1551060278U, // <2,3,4,4>: Cost 2 vsldoi4 <1,2,3,4>, RHS
+  537709878U,  // <2,3,4,5>: Cost 1 vsldoi8 LHS, RHS
+  2732969337U, // <2,3,4,6>: Cost 3 vsldoi8 LHS, <4,6,5,2>
+  2660635824U, // <2,3,4,7>: Cost 3 vsldoi4 <7,2,3,4>, <7,2,3,4>
+  537710121U,  // <2,3,4,u>: Cost 1 vsldoi8 LHS, RHS
+  2689838664U, // <2,3,5,0>: Cost 3 vsldoi8 LHS, <5,0,1,2>
+  2732969615U, // <2,3,5,1>: Cost 3 vsldoi8 LHS, <5,1,0,1>
+  2732969707U, // <2,3,5,2>: Cost 3 vsldoi8 LHS, <5,2,1,3>
   3763580721U, // <2,3,5,3>: Cost 4 vsldoi8 LHS, <5,3,0,1>
-  3763580852U, // <2,3,5,4>: Cost 3 vsldoi8 LHS, <5,4,5,6>
-  2732969988U, // <2,3,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
-  2732970082U, // <2,3,5,6>: Cost 2 vsldoi8 LHS, <5,6,7,0>
+  2689839028U, // <2,3,5,4>: Cost 3 vsldoi8 LHS, <5,4,5,6>
+  1659228164U, // <2,3,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
+  1659228258U, // <2,3,5,6>: Cost 2 vsldoi8 LHS, <5,6,7,0>
   3364259770U, // <2,3,5,7>: Cost 4 vmrglw <1,4,2,5>, <2,6,3,7>
-  2732970244U, // <2,3,5,u>: Cost 2 vsldoi8 LHS, <5,u,7,0>
-  3304540310U, // <2,3,6,0>: Cost 3 vmrghw <2,6,3,7>, <3,0,1,2>
-  3806712231U, // <2,3,6,1>: Cost 3 vsldoi8 LHS, <6,1,7,1>
-  2732970490U, // <2,3,6,2>: Cost 2 vsldoi8 LHS, <6,2,7,3>
-  3304540572U, // <2,3,6,3>: Cost 3 vmrghw <2,6,3,7>, <3,3,3,3>
-  3304540674U, // <2,3,6,4>: Cost 3 vmrghw <2,6,3,7>, <3,4,5,6>
-  3806712555U, // <2,3,6,5>: Cost 3 vsldoi8 LHS, <6,5,7,1>
-  2732970808U, // <2,3,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
-  2732970830U, // <2,3,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
-  2732970911U, // <2,3,6,u>: Cost 2 vsldoi8 LHS, <6,u,0,1>
-  2732971002U, // <2,3,7,0>: Cost 2 vsldoi8 LHS, <7,0,1,2>
-  3800740949U, // <2,3,7,1>: Cost 3 vsldoi8 <7,1,2,3>, <7,1,2,3>
-  3801404582U, // <2,3,7,2>: Cost 3 vsldoi8 <7,2,2,3>, <7,2,2,3>
-  3806713059U, // <2,3,7,3>: Cost 3 vsldoi8 LHS, <7,3,0,1>
-  2732971366U, // <2,3,7,4>: Cost 2 vsldoi8 LHS, <7,4,5,6>
-  3806713270U, // <2,3,7,5>: Cost 3 vsldoi8 LHS, <7,5,5,5>
-  3806713308U, // <2,3,7,6>: Cost 3 vsldoi8 LHS, <7,6,0,7>
-  2732971628U, // <2,3,7,7>: Cost 2 vsldoi8 LHS, <7,7,7,7>
-  2732971650U, // <2,3,7,u>: Cost 2 vsldoi8 LHS, <7,u,1,2>
-  2282578838U, // <2,3,u,0>: Cost 2 vmrglw LHS, <1,2,3,0>
-  1611454254U, // <2,3,u,1>: Cost 1 vsldoi8 LHS, LHS
-  2689841029U, // <2,3,u,2>: Cost 2 vsldoi8 LHS, <u,2,3,0>
-  2282579570U, // <2,3,u,3>: Cost 2 vmrglw LHS, <2,2,3,3>
-  2282578842U, // <2,3,u,4>: Cost 2 vmrglw LHS, <1,2,3,4>
-  1611454618U, // <2,3,u,5>: Cost 1 vsldoi8 LHS, RHS
-  2689841360U, // <2,3,u,6>: Cost 2 vsldoi8 LHS, <u,6,3,7>
-  2282579898U, // <2,3,u,7>: Cost 2 vmrglw LHS, <2,6,3,7>
-  1611454821U, // <2,3,u,u>: Cost 1 vsldoi8 LHS, LHS
+  1659228420U, // <2,3,5,u>: Cost 2 vsldoi8 LHS, <5,u,7,0>
+  2230798486U, // <2,3,6,0>: Cost 3 vmrghw <2,6,3,7>, <3,0,1,2>
+  2732970407U, // <2,3,6,1>: Cost 3 vsldoi8 LHS, <6,1,7,1>
+  1659228666U, // <2,3,6,2>: Cost 2 vsldoi8 LHS, <6,2,7,3>
+  2230798748U, // <2,3,6,3>: Cost 3 vmrghw <2,6,3,7>, <3,3,3,3>
+  2230798850U, // <2,3,6,4>: Cost 3 vmrghw <2,6,3,7>, <3,4,5,6>
+  2732970731U, // <2,3,6,5>: Cost 3 vsldoi8 LHS, <6,5,7,1>
+  1659228984U, // <2,3,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
+  1659229006U, // <2,3,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
+  1659229087U, // <2,3,6,u>: Cost 2 vsldoi8 LHS, <6,u,0,1>
+  1659229178U, // <2,3,7,0>: Cost 2 vsldoi8 LHS, <7,0,1,2>
+  2726999125U, // <2,3,7,1>: Cost 3 vsldoi8 <7,1,2,3>, <7,1,2,3>
+  2727662758U, // <2,3,7,2>: Cost 3 vsldoi8 <7,2,2,3>, <7,2,2,3>
+  2732971235U, // <2,3,7,3>: Cost 3 vsldoi8 LHS, <7,3,0,1>
+  1659229542U, // <2,3,7,4>: Cost 2 vsldoi8 LHS, <7,4,5,6>
+  2732971446U, // <2,3,7,5>: Cost 3 vsldoi8 LHS, <7,5,5,5>
+  2732971484U, // <2,3,7,6>: Cost 3 vsldoi8 LHS, <7,6,0,7>
+  1659229804U, // <2,3,7,7>: Cost 2 vsldoi8 LHS, <7,7,7,7>
+  1659229826U, // <2,3,7,u>: Cost 2 vsldoi8 LHS, <7,u,1,2>
+  1208837014U, // <2,3,u,0>: Cost 2 vmrglw LHS, <1,2,3,0>
+  537712430U,  // <2,3,u,1>: Cost 1 vsldoi8 LHS, LHS
+  1616099205U, // <2,3,u,2>: Cost 2 vsldoi8 LHS, <u,2,3,0>
+  1208837746U, // <2,3,u,3>: Cost 2 vmrglw LHS, <2,2,3,3>
+  1208837018U, // <2,3,u,4>: Cost 2 vmrglw LHS, <1,2,3,4>
+  537712794U,  // <2,3,u,5>: Cost 1 vsldoi8 LHS, RHS
+  1616099536U, // <2,3,u,6>: Cost 2 vsldoi8 LHS, <u,6,3,7>
+  1208838074U, // <2,3,u,7>: Cost 2 vmrglw LHS, <2,6,3,7>
+  537712997U,  // <2,3,u,u>: Cost 1 vsldoi8 LHS, LHS
   3771547648U, // <2,4,0,0>: Cost 4 vsldoi8 <2,2,2,4>, <0,0,0,0>
-  3771547750U, // <2,4,0,1>: Cost 3 vsldoi8 <2,2,2,4>, LHS
+  2697805926U, // <2,4,0,1>: Cost 3 vsldoi8 <2,2,2,4>, LHS
   3770884269U, // <2,4,0,2>: Cost 4 vsldoi8 <2,1,2,4>, <0,2,1,2>
   3806716164U, // <2,4,0,3>: Cost 4 vsldoi8 <u,1,2,4>, <0,3,1,u>
   3771547986U, // <2,4,0,4>: Cost 4 vsldoi8 <2,2,2,4>, <0,4,1,5>
-  3300502838U, // <2,4,0,5>: Cost 3 vmrghw <2,0,3,0>, RHS
+  2226761014U, // <2,4,0,5>: Cost 3 vmrghw <2,0,3,0>, RHS
   3853462427U, // <2,4,0,6>: Cost 4 vsldoi12 <4,6,5,2>, <4,0,6,1>
   3867102116U, // <2,4,0,7>: Cost 4 vsldoi12 <7,0,1,2>, <4,0,7,1>
-  3300503081U, // <2,4,0,u>: Cost 3 vmrghw <2,0,3,0>, RHS
+  2226761257U, // <2,4,0,u>: Cost 3 vmrghw <2,0,3,0>, RHS
   3849186231U, // <2,4,1,0>: Cost 4 vsldoi12 <4,0,1,2>, <4,1,0,2>
   3301207010U, // <2,4,1,1>: Cost 4 vmrghw <2,1,3,5>, <4,1,5,0>
   3766240150U, // <2,4,1,2>: Cost 4 vsldoi8 <1,3,2,4>, <1,2,3,0>
   3766240226U, // <2,4,1,3>: Cost 4 vsldoi8 <1,3,2,4>, <1,3,2,4>
   3301207248U, // <2,4,1,4>: Cost 4 vmrghw <2,1,3,5>, <4,4,4,4>
-  3301174582U, // <2,4,1,5>: Cost 3 vmrghw <2,1,3,1>, RHS
+  2227432758U, // <2,4,1,5>: Cost 3 vmrghw <2,1,3,1>, RHS
   3758941400U, // <2,4,1,6>: Cost 4 vsldoi8 <0,1,2,4>, <1,6,2,7>
   3768894758U, // <2,4,1,7>: Cost 4 vsldoi8 <1,7,2,4>, <1,7,2,4>
-  3301174825U, // <2,4,1,u>: Cost 3 vmrghw <2,1,3,1>, RHS
-  3301772178U, // <2,4,2,0>: Cost 3 vmrghw <2,2,2,2>, <4,0,5,1>
+  2227433001U, // <2,4,1,u>: Cost 3 vmrghw <2,1,3,1>, RHS
+  2228030354U, // <2,4,2,0>: Cost 3 vmrghw <2,2,2,2>, <4,0,5,1>
   3770885657U, // <2,4,2,1>: Cost 4 vsldoi8 <2,1,2,4>, <2,1,2,4>
-  3771549290U, // <2,4,2,2>: Cost 3 vsldoi8 <2,2,2,4>, <2,2,2,4>
+  2697807466U, // <2,4,2,2>: Cost 3 vsldoi8 <2,2,2,4>, <2,2,2,4>
   3368880468U, // <2,4,2,3>: Cost 4 vmrglw <2,2,2,2>, <3,2,4,3>
-  3301772496U, // <2,4,2,4>: Cost 3 vmrghw <2,2,2,2>, <4,4,4,4>
-  2228030774U, // <2,4,2,5>: Cost 2 vmrghw <2,2,2,2>, RHS
+  2228030672U, // <2,4,2,4>: Cost 3 vmrghw <2,2,2,2>, <4,4,4,4>
+  1154288950U, // <2,4,2,5>: Cost 2 vmrghw <2,2,2,2>, RHS
   3771549617U, // <2,4,2,6>: Cost 4 vsldoi8 <2,2,2,4>, <2,6,2,7>
   3368880796U, // <2,4,2,7>: Cost 4 vmrglw <2,2,2,2>, <3,6,4,7>
-  2228031017U, // <2,4,2,u>: Cost 2 vmrghw <2,2,2,2>, RHS
-  3710550118U, // <2,4,3,0>: Cost 3 vsldoi4 <3,2,4,3>, LHS
-  3360923685U, // <2,4,3,1>: Cost 3 vmrglw LHS, <0,0,4,1>
-  3302607926U, // <2,4,3,2>: Cost 3 vmrghw <2,3,4,5>, <4,2,5,3>
-  3710552404U, // <2,4,3,3>: Cost 3 vsldoi4 <3,2,4,3>, <3,2,4,3>
-  2330315984U, // <2,4,3,4>: Cost 2 vmrglw LHS, <4,4,4,4>
-  2287183566U, // <2,4,3,5>: Cost 2 vmrglw LHS, <2,3,4,5>
-  3302608254U, // <2,4,3,6>: Cost 3 vmrghw <2,3,4,5>, <4,6,5,7>
-  3734443192U, // <2,4,3,7>: Cost 3 vsldoi4 <7,2,4,3>, <7,2,4,3>
-  2287183569U, // <2,4,3,u>: Cost 2 vmrglw LHS, <2,3,4,u>
+  1154289193U, // <2,4,2,u>: Cost 2 vmrghw <2,2,2,2>, RHS
+  2636808294U, // <2,4,3,0>: Cost 3 vsldoi4 <3,2,4,3>, LHS
+  2287181861U, // <2,4,3,1>: Cost 3 vmrglw LHS, <0,0,4,1>
+  2228866102U, // <2,4,3,2>: Cost 3 vmrghw <2,3,4,5>, <4,2,5,3>
+  2636810580U, // <2,4,3,3>: Cost 3 vsldoi4 <3,2,4,3>, <3,2,4,3>
+  1256574160U, // <2,4,3,4>: Cost 2 vmrglw LHS, <4,4,4,4>
+  1213441742U, // <2,4,3,5>: Cost 2 vmrglw LHS, <2,3,4,5>
+  2228866430U, // <2,4,3,6>: Cost 3 vmrghw <2,3,4,5>, <4,6,5,7>
+  2660701368U, // <2,4,3,7>: Cost 3 vsldoi4 <7,2,4,3>, <7,2,4,3>
+  1213441745U, // <2,4,3,u>: Cost 2 vmrglw LHS, <2,3,4,u>
   3704586342U, // <2,4,4,0>: Cost 4 vsldoi4 <2,2,4,4>, LHS
   3782831051U, // <2,4,4,1>: Cost 4 vsldoi8 <4,1,2,4>, <4,1,2,4>
   3704587900U, // <2,4,4,2>: Cost 4 vsldoi4 <2,2,4,4>, <2,2,4,4>
   3368896123U, // <2,4,4,3>: Cost 4 vmrglw <2,2,2,4>, <2,2,4,3>
-  3867102416U, // <2,4,4,4>: Cost 3 vsldoi12 <7,0,1,2>, <4,4,4,4>
-  3771551030U, // <2,4,4,5>: Cost 3 vsldoi8 <2,2,2,4>, RHS
+  2793360592U, // <2,4,4,4>: Cost 3 vsldoi12 <7,0,1,2>, <4,4,4,4>
+  2697809206U, // <2,4,4,5>: Cost 3 vsldoi8 <2,2,2,4>, RHS
   3303198078U, // <2,4,4,6>: Cost 4 vmrghw <2,4,3,5>, <4,6,5,7>
   3867102444U, // <2,4,4,7>: Cost 4 vsldoi12 <7,0,1,2>, <4,4,7,5>
-  3771551273U, // <2,4,4,u>: Cost 3 vsldoi8 <2,2,2,4>, RHS
-  3704594534U, // <2,4,5,0>: Cost 3 vsldoi4 <2,2,4,5>, LHS
-  3698623396U, // <2,4,5,1>: Cost 3 vsldoi4 <1,2,4,5>, <1,2,4,5>
-  3704596093U, // <2,4,5,2>: Cost 3 vsldoi4 <2,2,4,5>, <2,2,4,5>
-  3740428501U, // <2,4,5,3>: Cost 3 vsldoi4 <u,2,4,5>, <3,0,u,2>
-  3704597814U, // <2,4,5,4>: Cost 3 vsldoi4 <2,2,4,5>, RHS
-  3303869750U, // <2,4,5,5>: Cost 3 vmrghw <2,5,3,6>, RHS
-  2764901686U, // <2,4,5,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
+  2697809449U, // <2,4,4,u>: Cost 3 vsldoi8 <2,2,2,4>, RHS
+  2630852710U, // <2,4,5,0>: Cost 3 vsldoi4 <2,2,4,5>, LHS
+  2624881572U, // <2,4,5,1>: Cost 3 vsldoi4 <1,2,4,5>, <1,2,4,5>
+  2630854269U, // <2,4,5,2>: Cost 3 vsldoi4 <2,2,4,5>, <2,2,4,5>
+  2666686677U, // <2,4,5,3>: Cost 3 vsldoi4 <u,2,4,5>, <3,0,u,2>
+  2630855990U, // <2,4,5,4>: Cost 3 vsldoi4 <2,2,4,5>, RHS
+  2230127926U, // <2,4,5,5>: Cost 3 vmrghw <2,5,3,6>, RHS
+  1691159862U, // <2,4,5,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
   3867102520U, // <2,4,5,7>: Cost 4 vsldoi12 <7,0,1,2>, <4,5,7,0>
-  2764901704U, // <2,4,5,u>: Cost 2 vsldoi12 <2,2,2,2>, RHS
-  3304541074U, // <2,4,6,0>: Cost 3 vmrghw <2,6,3,7>, <4,0,5,1>
+  1691159880U, // <2,4,5,u>: Cost 2 vsldoi12 <2,2,2,2>, RHS
+  2230799250U, // <2,4,6,0>: Cost 3 vmrghw <2,6,3,7>, <4,0,5,1>
   3304541130U, // <2,4,6,1>: Cost 4 vmrghw <2,6,3,7>, <4,1,2,3>
-  3304541241U, // <2,4,6,2>: Cost 3 vmrghw <2,6,3,7>, <4,2,5,6>
+  2230799417U, // <2,4,6,2>: Cost 3 vmrghw <2,6,3,7>, <4,2,5,6>
   3304541323U, // <2,4,6,3>: Cost 4 vmrghw <2,6,3,7>, <4,3,5,7>
-  3304541392U, // <2,4,6,4>: Cost 3 vmrghw <2,6,3,7>, <4,4,4,4>
-  2230799670U, // <2,4,6,5>: Cost 2 vmrghw <2,6,3,7>, RHS
+  2230799568U, // <2,4,6,4>: Cost 3 vmrghw <2,6,3,7>, <4,4,4,4>
+  1157057846U, // <2,4,6,5>: Cost 2 vmrghw <2,6,3,7>, RHS
   3304541566U, // <2,4,6,6>: Cost 4 vmrghw <2,6,3,7>, <4,6,5,7>
   3798758243U, // <2,4,6,7>: Cost 4 vsldoi8 <6,7,2,4>, <6,7,2,4>
-  2230799913U, // <2,4,6,u>: Cost 2 vmrghw <2,6,3,7>, RHS
+  1157058089U, // <2,4,6,u>: Cost 2 vmrghw <2,6,3,7>, RHS
   3806721018U, // <2,4,7,0>: Cost 4 vsldoi8 <u,1,2,4>, <7,0,1,2>
   3853831590U, // <2,4,7,1>: Cost 4 vsldoi12 <4,7,1,2>, <4,7,1,2>
   3801412775U, // <2,4,7,2>: Cost 4 vsldoi8 <7,2,2,4>, <7,2,2,4>
   3802076408U, // <2,4,7,3>: Cost 4 vsldoi8 <7,3,2,4>, <7,3,2,4>
   3401436368U, // <2,4,7,4>: Cost 4 vmrglw <7,6,2,7>, <4,4,4,4>
-  3867102664U, // <2,4,7,5>: Cost 3 vsldoi12 <7,0,1,2>, <4,7,5,0>
+  2793360840U, // <2,4,7,5>: Cost 3 vsldoi12 <7,0,1,2>, <4,7,5,0>
   3804067307U, // <2,4,7,6>: Cost 4 vsldoi8 <7,6,2,4>, <7,6,2,4>
   3867102682U, // <2,4,7,7>: Cost 4 vsldoi12 <7,0,1,2>, <4,7,7,0>
-  3867102691U, // <2,4,7,u>: Cost 3 vsldoi12 <7,0,1,2>, <4,7,u,0>
-  3704619110U, // <2,4,u,0>: Cost 3 vsldoi4 <2,2,4,u>, LHS
-  3356321968U, // <2,4,u,1>: Cost 3 vmrglw LHS, <3,0,4,1>
-  3704620672U, // <2,4,u,2>: Cost 3 vsldoi4 <2,2,4,u>, <2,2,4,u>
-  3710593369U, // <2,4,u,3>: Cost 3 vsldoi4 <3,2,4,u>, <3,2,4,u>
-  2330356944U, // <2,4,u,4>: Cost 2 vmrglw LHS, <4,4,4,4>
-  2282579662U, // <2,4,u,5>: Cost 2 vmrglw LHS, <2,3,4,5>
-  2764901929U, // <2,4,u,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
-  3734484157U, // <2,4,u,7>: Cost 3 vsldoi4 <7,2,4,u>, <7,2,4,u>
-  2282579665U, // <2,4,u,u>: Cost 2 vmrglw LHS, <2,3,4,u>
+  2793360867U, // <2,4,7,u>: Cost 3 vsldoi12 <7,0,1,2>, <4,7,u,0>
+  2630877286U, // <2,4,u,0>: Cost 3 vsldoi4 <2,2,4,u>, LHS
+  2282580144U, // <2,4,u,1>: Cost 3 vmrglw LHS, <3,0,4,1>
+  2630878848U, // <2,4,u,2>: Cost 3 vsldoi4 <2,2,4,u>, <2,2,4,u>
+  2636851545U, // <2,4,u,3>: Cost 3 vsldoi4 <3,2,4,u>, <3,2,4,u>
+  1256615120U, // <2,4,u,4>: Cost 2 vmrglw LHS, <4,4,4,4>
+  1208837838U, // <2,4,u,5>: Cost 2 vmrglw LHS, <2,3,4,5>
+  1691160105U, // <2,4,u,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
+  2660742333U, // <2,4,u,7>: Cost 3 vsldoi4 <7,2,4,u>, <7,2,4,u>
+  1208837841U, // <2,4,u,u>: Cost 2 vmrglw LHS, <2,3,4,u>
   3766910976U, // <2,5,0,0>: Cost 4 vsldoi8 <1,4,2,5>, <0,0,0,0>
-  3766911078U, // <2,5,0,1>: Cost 3 vsldoi8 <1,4,2,5>, LHS
+  2693169254U, // <2,5,0,1>: Cost 3 vsldoi8 <1,4,2,5>, LHS
   3760939181U, // <2,5,0,2>: Cost 4 vsldoi8 <0,4,2,5>, <0,2,1,2>
   3843214936U, // <2,5,0,3>: Cost 4 vsldoi12 <3,0,1,2>, <5,0,3,0>
   3760939355U, // <2,5,0,4>: Cost 4 vsldoi8 <0,4,2,5>, <0,4,2,5>
   3867102827U, // <2,5,0,5>: Cost 4 vsldoi12 <7,0,1,2>, <5,0,5,1>
   3867102836U, // <2,5,0,6>: Cost 4 vsldoi12 <7,0,1,2>, <5,0,6,1>
   3867102844U, // <2,5,0,7>: Cost 4 vsldoi12 <7,0,1,2>, <5,0,7,0>
-  3766911645U, // <2,5,0,u>: Cost 3 vsldoi8 <1,4,2,5>, LHS
+  2693169821U, // <2,5,0,u>: Cost 3 vsldoi8 <1,4,2,5>, LHS
   3766911724U, // <2,5,1,0>: Cost 4 vsldoi8 <1,4,2,5>, <1,0,2,1>
   3766911796U, // <2,5,1,1>: Cost 4 vsldoi8 <1,4,2,5>, <1,1,1,1>
-  3766911894U, // <2,5,1,2>: Cost 3 vsldoi8 <1,4,2,5>, <1,2,3,0>
+  2693170070U, // <2,5,1,2>: Cost 3 vsldoi8 <1,4,2,5>, <1,2,3,0>
   3384798262U, // <2,5,1,3>: Cost 4 vmrglw <4,u,2,1>, <4,2,5,3>
-  3766912052U, // <2,5,1,4>: Cost 3 vsldoi8 <1,4,2,5>, <1,4,2,5>
+  2693170228U, // <2,5,1,4>: Cost 3 vsldoi8 <1,4,2,5>, <1,4,2,5>
   3301208068U, // <2,5,1,5>: Cost 4 vmrghw <2,1,3,5>, <5,5,5,5>
   3366879607U, // <2,5,1,6>: Cost 4 vmrglw <1,u,2,1>, <0,4,5,6>
   3867102925U, // <2,5,1,7>: Cost 4 vsldoi12 <7,0,1,2>, <5,1,7,0>
-  3769566584U, // <2,5,1,u>: Cost 3 vsldoi8 <1,u,2,5>, <1,u,2,5>
-  3716587622U, // <2,5,2,0>: Cost 3 vsldoi4 <4,2,5,2>, LHS
-  3368881042U, // <2,5,2,1>: Cost 3 vmrglw <2,2,2,2>, <4,0,5,1>
-  3772884584U, // <2,5,2,2>: Cost 3 vsldoi8 <2,4,2,5>, <2,2,2,2>
+  2695824760U, // <2,5,1,u>: Cost 3 vsldoi8 <1,u,2,5>, <1,u,2,5>
+  2642845798U, // <2,5,2,0>: Cost 3 vsldoi4 <4,2,5,2>, LHS
+  2295139218U, // <2,5,2,1>: Cost 3 vmrglw <2,2,2,2>, <4,0,5,1>
+  2699142760U, // <2,5,2,2>: Cost 3 vsldoi8 <2,4,2,5>, <2,2,2,2>
   3766912678U, // <2,5,2,3>: Cost 4 vsldoi8 <1,4,2,5>, <2,3,0,1>
-  3772884749U, // <2,5,2,4>: Cost 3 vsldoi8 <2,4,2,5>, <2,4,2,5>
-  3301773316U, // <2,5,2,5>: Cost 3 vmrghw <2,2,2,2>, <5,5,5,5>
-  3368880642U, // <2,5,2,6>: Cost 3 vmrglw <2,2,2,2>, <3,4,5,6>
+  2699142925U, // <2,5,2,4>: Cost 3 vsldoi8 <2,4,2,5>, <2,4,2,5>
+  2228031492U, // <2,5,2,5>: Cost 3 vmrghw <2,2,2,2>, <5,5,5,5>
+  2295138818U, // <2,5,2,6>: Cost 3 vmrglw <2,2,2,2>, <3,4,5,6>
   3368879347U, // <2,5,2,7>: Cost 4 vmrglw <2,2,2,2>, <1,6,5,7>
-  3368880644U, // <2,5,2,u>: Cost 3 vmrglw <2,2,2,2>, <3,4,5,u>
-  3360926690U, // <2,5,3,0>: Cost 3 vmrglw LHS, <4,1,5,0>
-  2330315666U, // <2,5,3,1>: Cost 2 vmrglw LHS, <4,0,5,1>
-  3716597454U, // <2,5,3,2>: Cost 3 vsldoi4 <4,2,5,3>, <2,3,4,5>
-  3360924587U, // <2,5,3,3>: Cost 3 vmrglw LHS, <1,2,5,3>
-  3360926694U, // <2,5,3,4>: Cost 3 vmrglw LHS, <4,1,5,4>
-  2330315994U, // <2,5,3,5>: Cost 2 vmrglw LHS, <4,4,5,5>
-  2287184386U, // <2,5,3,6>: Cost 2 vmrglw LHS, <3,4,5,6>
-  3360924915U, // <2,5,3,7>: Cost 3 vmrglw LHS, <1,6,5,7>
-  2287184388U, // <2,5,3,u>: Cost 2 vmrglw LHS, <3,4,5,u>
+  2295138820U, // <2,5,2,u>: Cost 3 vmrglw <2,2,2,2>, <3,4,5,u>
+  2287184866U, // <2,5,3,0>: Cost 3 vmrglw LHS, <4,1,5,0>
+  1256573842U, // <2,5,3,1>: Cost 2 vmrglw LHS, <4,0,5,1>
+  2642855630U, // <2,5,3,2>: Cost 3 vsldoi4 <4,2,5,3>, <2,3,4,5>
+  2287182763U, // <2,5,3,3>: Cost 3 vmrglw LHS, <1,2,5,3>
+  2287184870U, // <2,5,3,4>: Cost 3 vmrglw LHS, <4,1,5,4>
+  1256574170U, // <2,5,3,5>: Cost 2 vmrglw LHS, <4,4,5,5>
+  1213442562U, // <2,5,3,6>: Cost 2 vmrglw LHS, <3,4,5,6>
+  2287183091U, // <2,5,3,7>: Cost 3 vmrglw LHS, <1,6,5,7>
+  1213442564U, // <2,5,3,u>: Cost 2 vmrglw LHS, <3,4,5,u>
   3716604006U, // <2,5,4,0>: Cost 4 vsldoi4 <4,2,5,4>, LHS
   3716604822U, // <2,5,4,1>: Cost 4 vsldoi4 <4,2,5,4>, <1,2,3,0>
   3766914099U, // <2,5,4,2>: Cost 4 vsldoi8 <1,4,2,5>, <4,2,5,0>
   3368895403U, // <2,5,4,3>: Cost 5 vmrglw <2,2,2,4>, <1,2,5,3>
   3716607031U, // <2,5,4,4>: Cost 4 vsldoi4 <4,2,5,4>, <4,2,5,4>
-  3766914358U, // <2,5,4,5>: Cost 3 vsldoi8 <1,4,2,5>, RHS
+  2693172534U, // <2,5,4,5>: Cost 3 vsldoi8 <1,4,2,5>, RHS
   3363588610U, // <2,5,4,6>: Cost 4 vmrglw <1,3,2,4>, <3,4,5,6>
   3368895731U, // <2,5,4,7>: Cost 5 vmrglw <2,2,2,4>, <1,6,5,7>
-  3766914601U, // <2,5,4,u>: Cost 3 vsldoi8 <1,4,2,5>, RHS
+  2693172777U, // <2,5,4,u>: Cost 3 vsldoi8 <1,4,2,5>, RHS
   3704668262U, // <2,5,5,0>: Cost 4 vsldoi4 <2,2,5,5>, LHS
   3704669078U, // <2,5,5,1>: Cost 4 vsldoi4 <2,2,5,5>, <1,2,3,0>
   3704669830U, // <2,5,5,2>: Cost 4 vsldoi4 <2,2,5,5>, <2,2,5,5>
   3364259460U, // <2,5,5,3>: Cost 4 vmrglw <1,4,2,5>, <2,2,5,3>
   3704671542U, // <2,5,5,4>: Cost 4 vsldoi4 <2,2,5,5>, RHS
-  3867103236U, // <2,5,5,5>: Cost 3 vsldoi12 <7,0,1,2>, <5,5,5,5>
+  2793361412U, // <2,5,5,5>: Cost 3 vsldoi12 <7,0,1,2>, <5,5,5,5>
   3364258167U, // <2,5,5,6>: Cost 4 vmrglw <1,4,2,5>, <0,4,5,6>
   3867103249U, // <2,5,5,7>: Cost 4 vsldoi12 <7,0,1,2>, <5,5,7,0>
-  3867103236U, // <2,5,5,u>: Cost 3 vsldoi12 <7,0,1,2>, <5,5,5,5>
-  3716620390U, // <2,5,6,0>: Cost 3 vsldoi4 <4,2,5,6>, LHS
+  2793361412U, // <2,5,5,u>: Cost 3 vsldoi12 <7,0,1,2>, <5,5,5,5>
+  2642878566U, // <2,5,6,0>: Cost 3 vsldoi4 <4,2,5,6>, LHS
   3386166810U, // <2,5,6,1>: Cost 4 vmrglw <5,1,2,6>, <4,u,5,1>
-  3796775418U, // <2,5,6,2>: Cost 3 vsldoi8 <6,4,2,5>, <6,2,7,3>
+  2723033594U, // <2,5,6,2>: Cost 3 vsldoi8 <6,4,2,5>, <6,2,7,3>
   3848523842U, // <2,5,6,3>: Cost 4 vsldoi12 <3,u,1,2>, <5,6,3,4>
-  3796775537U, // <2,5,6,4>: Cost 3 vsldoi8 <6,4,2,5>, <6,4,2,5>
-  3304542212U, // <2,5,6,5>: Cost 3 vmrghw <2,6,3,7>, <5,5,5,5>
-  3304542306U, // <2,5,6,6>: Cost 3 vmrghw <2,6,3,7>, <5,6,7,0>
-  3859583076U, // <2,5,6,7>: Cost 3 vsldoi12 <5,6,7,2>, <5,6,7,2>
-  3859656813U, // <2,5,6,u>: Cost 3 vsldoi12 <5,6,u,2>, <5,6,u,2>
+  2723033713U, // <2,5,6,4>: Cost 3 vsldoi8 <6,4,2,5>, <6,4,2,5>
+  2230800388U, // <2,5,6,5>: Cost 3 vmrghw <2,6,3,7>, <5,5,5,5>
+  2230800482U, // <2,5,6,6>: Cost 3 vmrghw <2,6,3,7>, <5,6,7,0>
+  2785841252U, // <2,5,6,7>: Cost 3 vsldoi12 <5,6,7,2>, <5,6,7,2>
+  2785914989U, // <2,5,6,u>: Cost 3 vsldoi12 <5,6,u,2>, <5,6,u,2>
   3796775930U, // <2,5,7,0>: Cost 4 vsldoi8 <6,4,2,5>, <7,0,1,2>
   3800757335U, // <2,5,7,1>: Cost 4 vsldoi8 <7,1,2,5>, <7,1,2,5>
   3853463689U, // <2,5,7,2>: Cost 4 vsldoi12 <4,6,5,2>, <5,7,2,3>
@@ -1956,24 +1956,24 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3371575081U, // <2,5,7,6>: Cost 4 vmrglw <2,6,2,7>, <2,4,5,6>
   3796776516U, // <2,5,7,7>: Cost 4 vsldoi8 <6,4,2,5>, <7,7,3,3>
   3371575083U, // <2,5,7,u>: Cost 4 vmrglw <2,6,2,7>, <2,4,5,u>
-  3360967650U, // <2,5,u,0>: Cost 3 vmrglw LHS, <4,1,5,0>
-  2330356626U, // <2,5,u,1>: Cost 2 vmrglw LHS, <4,0,5,1>
-  3716638414U, // <2,5,u,2>: Cost 3 vsldoi4 <4,2,5,u>, <2,3,4,5>
-  3360965547U, // <2,5,u,3>: Cost 3 vmrglw LHS, <1,2,5,3>
-  3360967654U, // <2,5,u,4>: Cost 3 vmrglw LHS, <4,1,5,4>
-  2330356954U, // <2,5,u,5>: Cost 2 vmrglw LHS, <4,4,5,5>
-  2282580482U, // <2,5,u,6>: Cost 2 vmrglw LHS, <3,4,5,6>
-  3360965875U, // <2,5,u,7>: Cost 3 vmrglw LHS, <1,6,5,7>
-  2282580484U, // <2,5,u,u>: Cost 2 vmrglw LHS, <3,4,5,u>
+  2287225826U, // <2,5,u,0>: Cost 3 vmrglw LHS, <4,1,5,0>
+  1256614802U, // <2,5,u,1>: Cost 2 vmrglw LHS, <4,0,5,1>
+  2642896590U, // <2,5,u,2>: Cost 3 vsldoi4 <4,2,5,u>, <2,3,4,5>
+  2287223723U, // <2,5,u,3>: Cost 3 vmrglw LHS, <1,2,5,3>
+  2287225830U, // <2,5,u,4>: Cost 3 vmrglw LHS, <4,1,5,4>
+  1256615130U, // <2,5,u,5>: Cost 2 vmrglw LHS, <4,4,5,5>
+  1208838658U, // <2,5,u,6>: Cost 2 vmrglw LHS, <3,4,5,6>
+  2287224051U, // <2,5,u,7>: Cost 3 vmrglw LHS, <1,6,5,7>
+  1208838660U, // <2,5,u,u>: Cost 2 vmrglw LHS, <3,4,5,u>
   3772227584U, // <2,6,0,0>: Cost 4 vsldoi8 <2,3,2,6>, <0,0,0,0>
-  3772227686U, // <2,6,0,1>: Cost 3 vsldoi8 <2,3,2,6>, LHS
+  2698485862U, // <2,6,0,1>: Cost 3 vsldoi8 <2,3,2,6>, LHS
   3759620282U, // <2,6,0,2>: Cost 4 vsldoi8 <0,2,2,6>, <0,2,2,6>
   3710675299U, // <2,6,0,3>: Cost 4 vsldoi4 <3,2,6,0>, <3,2,6,0>
   3767583058U, // <2,6,0,4>: Cost 4 vsldoi8 <1,5,2,6>, <0,4,1,5>
   3378153265U, // <2,6,0,5>: Cost 5 vmrglw <3,7,2,0>, <2,4,6,5>
   3865186637U, // <2,6,0,6>: Cost 4 vsldoi12 <6,6,2,2>, <6,0,6,1>
-  3404033334U, // <2,6,0,7>: Cost 3 vmrglw <u,1,2,0>, RHS
-  3772228253U, // <2,6,0,u>: Cost 3 vsldoi8 <2,3,2,6>, LHS
+  2330291510U, // <2,6,0,7>: Cost 3 vmrglw <u,1,2,0>, RHS
+  2698486429U, // <2,6,0,u>: Cost 3 vsldoi8 <2,3,2,6>, LHS
   3734569062U, // <2,6,1,0>: Cost 4 vsldoi4 <7,2,6,1>, LHS
   3764929346U, // <2,6,1,1>: Cost 4 vsldoi8 <1,1,2,6>, <1,1,2,6>
   3772228502U, // <2,6,1,2>: Cost 4 vsldoi8 <2,3,2,6>, <1,2,3,0>
@@ -1981,35 +1981,35 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3734572342U, // <2,6,1,4>: Cost 4 vsldoi4 <7,2,6,1>, RHS
   3767583878U, // <2,6,1,5>: Cost 4 vsldoi8 <1,5,2,6>, <1,5,2,6>
   3768247511U, // <2,6,1,6>: Cost 4 vsldoi8 <1,6,2,6>, <1,6,2,6>
-  3366882614U, // <2,6,1,7>: Cost 3 vmrglw <1,u,2,1>, RHS
-  3366882615U, // <2,6,1,u>: Cost 3 vmrglw <1,u,2,1>, RHS
+  2293140790U, // <2,6,1,7>: Cost 3 vmrglw <1,u,2,1>, RHS
+  2293140791U, // <2,6,1,u>: Cost 3 vmrglw <1,u,2,1>, RHS
   3704717414U, // <2,6,2,0>: Cost 4 vsldoi4 <2,2,6,2>, LHS
   3395424589U, // <2,6,2,1>: Cost 4 vmrglw <6,6,2,2>, <6,0,6,1>
-  3301773817U, // <2,6,2,2>: Cost 3 vmrghw <2,2,2,2>, <6,2,7,2>
-  3772229309U, // <2,6,2,3>: Cost 3 vsldoi8 <2,3,2,6>, <2,3,2,6>
+  2228031993U, // <2,6,2,2>: Cost 3 vmrghw <2,2,2,2>, <6,2,7,2>
+  2698487485U, // <2,6,2,3>: Cost 3 vsldoi8 <2,3,2,6>, <2,3,2,6>
   3704720694U, // <2,6,2,4>: Cost 4 vsldoi4 <2,2,6,2>, RHS
   3773556575U, // <2,6,2,5>: Cost 4 vsldoi8 <2,5,2,6>, <2,5,2,6>
-  3772229562U, // <2,6,2,6>: Cost 3 vsldoi8 <2,3,2,6>, <2,6,3,7>
-  2295139638U, // <2,6,2,7>: Cost 2 vmrglw <2,2,2,2>, RHS
-  2295139639U, // <2,6,2,u>: Cost 2 vmrglw <2,2,2,2>, RHS
-  3710697574U, // <2,6,3,0>: Cost 3 vsldoi4 <3,2,6,3>, LHS
-  3404056041U, // <2,6,3,1>: Cost 3 vmrglw LHS, <2,0,6,1>
-  3710699450U, // <2,6,3,2>: Cost 3 vsldoi4 <3,2,6,3>, <2,6,3,7>
-  3360926054U, // <2,6,3,3>: Cost 3 vmrglw LHS, <3,2,6,3>
-  3710700854U, // <2,6,3,4>: Cost 3 vsldoi4 <3,2,6,3>, RHS
-  3722645272U, // <2,6,3,5>: Cost 3 vsldoi4 <5,2,6,3>, <5,2,6,3>
-  2330317624U, // <2,6,3,6>: Cost 2 vmrglw LHS, <6,6,6,6>
-  1208798518U, // <2,6,3,7>: Cost 1 vmrglw LHS, RHS
-  1208798519U, // <2,6,3,u>: Cost 1 vmrglw LHS, RHS
+  2698487738U, // <2,6,2,6>: Cost 3 vsldoi8 <2,3,2,6>, <2,6,3,7>
+  1221397814U, // <2,6,2,7>: Cost 2 vmrglw <2,2,2,2>, RHS
+  1221397815U, // <2,6,2,u>: Cost 2 vmrglw <2,2,2,2>, RHS
+  2636955750U, // <2,6,3,0>: Cost 3 vsldoi4 <3,2,6,3>, LHS
+  2330314217U, // <2,6,3,1>: Cost 3 vmrglw LHS, <2,0,6,1>
+  2636957626U, // <2,6,3,2>: Cost 3 vsldoi4 <3,2,6,3>, <2,6,3,7>
+  2287184230U, // <2,6,3,3>: Cost 3 vmrglw LHS, <3,2,6,3>
+  2636959030U, // <2,6,3,4>: Cost 3 vsldoi4 <3,2,6,3>, RHS
+  2648903448U, // <2,6,3,5>: Cost 3 vsldoi4 <5,2,6,3>, <5,2,6,3>
+  1256575800U, // <2,6,3,6>: Cost 2 vmrglw LHS, <6,6,6,6>
+  135056694U,  // <2,6,3,7>: Cost 1 vmrglw LHS, RHS
+  135056695U,  // <2,6,3,u>: Cost 1 vmrglw LHS, RHS
   3710705766U, // <2,6,4,0>: Cost 4 vsldoi4 <3,2,6,4>, LHS
   3698762677U, // <2,6,4,1>: Cost 5 vsldoi4 <1,2,6,4>, <1,2,6,4>
   3710707389U, // <2,6,4,2>: Cost 4 vsldoi4 <3,2,6,4>, <2,3,2,6>
   3710708071U, // <2,6,4,3>: Cost 4 vsldoi4 <3,2,6,4>, <3,2,6,4>
   3710709046U, // <2,6,4,4>: Cost 4 vsldoi4 <3,2,6,4>, RHS
-  3772230966U, // <2,6,4,5>: Cost 3 vsldoi8 <2,3,2,6>, RHS
+  2698489142U, // <2,6,4,5>: Cost 3 vsldoi8 <2,3,2,6>, RHS
   3796782457U, // <2,6,4,6>: Cost 4 vsldoi8 <6,4,2,6>, <4,6,5,2>
-  3368897846U, // <2,6,4,7>: Cost 3 vmrglw <2,2,2,4>, RHS
-  3368897847U, // <2,6,4,u>: Cost 3 vmrglw <2,2,2,4>, RHS
+  2295156022U, // <2,6,4,7>: Cost 3 vmrglw <2,2,2,4>, RHS
+  2295156023U, // <2,6,4,u>: Cost 3 vmrglw <2,2,2,4>, RHS
   3303870753U, // <2,6,5,0>: Cost 4 vmrghw <2,5,3,6>, <6,0,1,2>
   3788820134U, // <2,6,5,1>: Cost 4 vsldoi8 <5,1,2,6>, <5,1,2,6>
   3779530520U, // <2,6,5,2>: Cost 4 vsldoi8 <3,5,2,6>, <5,2,6,3>
@@ -2017,728 +2017,728 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3303871117U, // <2,6,5,4>: Cost 4 vmrghw <2,5,3,6>, <6,4,5,6>
   3791474666U, // <2,6,5,5>: Cost 4 vsldoi8 <5,5,2,6>, <5,5,2,6>
   3792138299U, // <2,6,5,6>: Cost 4 vsldoi8 <5,6,2,6>, <5,6,2,6>
-  3364261174U, // <2,6,5,7>: Cost 3 vmrglw <1,4,2,5>, RHS
-  3364261175U, // <2,6,5,u>: Cost 3 vmrglw <1,4,2,5>, RHS
-  3704750182U, // <2,6,6,0>: Cost 3 vsldoi4 <2,2,6,6>, LHS
+  2290519350U, // <2,6,5,7>: Cost 3 vmrglw <1,4,2,5>, RHS
+  2290519351U, // <2,6,5,u>: Cost 3 vmrglw <1,4,2,5>, RHS
+  2631008358U, // <2,6,6,0>: Cost 3 vsldoi4 <2,2,6,6>, LHS
   3372893673U, // <2,6,6,1>: Cost 4 vmrglw <2,u,2,6>, <2,0,6,1>
-  3865187088U, // <2,6,6,2>: Cost 3 vsldoi12 <6,6,2,2>, <6,6,2,2>
-  3304542792U, // <2,6,6,3>: Cost 3 vmrghw <2,6,3,7>, <6,3,7,0>
-  3704753462U, // <2,6,6,4>: Cost 3 vsldoi4 <2,2,6,6>, RHS
+  2791445264U, // <2,6,6,2>: Cost 3 vsldoi12 <6,6,2,2>, <6,6,2,2>
+  2230800968U, // <2,6,6,3>: Cost 3 vmrghw <2,6,3,7>, <6,3,7,0>
+  2631011638U, // <2,6,6,4>: Cost 3 vsldoi4 <2,2,6,6>, RHS
   3372894001U, // <2,6,6,5>: Cost 4 vmrglw <2,u,2,6>, <2,4,6,5>
-  3867104056U, // <2,6,6,6>: Cost 3 vsldoi12 <7,0,1,2>, <6,6,6,6>
-  3369577782U, // <2,6,6,7>: Cost 3 vmrglw <2,3,2,6>, RHS
-  3369577783U, // <2,6,6,u>: Cost 3 vmrglw <2,3,2,6>, RHS
-  3867104078U, // <2,6,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <6,7,0,1>
-  3865776984U, // <2,6,7,1>: Cost 3 vsldoi12 <6,7,1,2>, <6,7,1,2>
-  3865850721U, // <2,6,7,2>: Cost 3 vsldoi12 <6,7,2,2>, <6,7,2,2>
-  3843216232U, // <2,6,7,3>: Cost 3 vsldoi12 <3,0,1,2>, <6,7,3,0>
-  3867104118U, // <2,6,7,4>: Cost 3 vsldoi12 <7,0,1,2>, <6,7,4,5>
+  2793362232U, // <2,6,6,6>: Cost 3 vsldoi12 <7,0,1,2>, <6,6,6,6>
+  2295835958U, // <2,6,6,7>: Cost 3 vmrglw <2,3,2,6>, RHS
+  2295835959U, // <2,6,6,u>: Cost 3 vmrglw <2,3,2,6>, RHS
+  2793362254U, // <2,6,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <6,7,0,1>
+  2792035160U, // <2,6,7,1>: Cost 3 vsldoi12 <6,7,1,2>, <6,7,1,2>
+  2792108897U, // <2,6,7,2>: Cost 3 vsldoi12 <6,7,2,2>, <6,7,2,2>
+  2769474408U, // <2,6,7,3>: Cost 3 vsldoi12 <3,0,1,2>, <6,7,3,0>
+  2793362294U, // <2,6,7,4>: Cost 3 vsldoi12 <7,0,1,2>, <6,7,4,5>
   3371575089U, // <2,6,7,5>: Cost 4 vmrglw <2,6,2,7>, <2,4,6,5>
-  3866145669U, // <2,6,7,6>: Cost 3 vsldoi12 <6,7,6,2>, <6,7,6,2>
-  3371576630U, // <2,6,7,7>: Cost 3 vmrglw <2,6,2,7>, RHS
-  3371576631U, // <2,6,7,u>: Cost 3 vmrglw <2,6,2,7>, RHS
-  3710738534U, // <2,6,u,0>: Cost 3 vsldoi4 <3,2,6,u>, LHS
-  3772233518U, // <2,6,u,1>: Cost 3 vsldoi8 <2,3,2,6>, LHS
-  3710740455U, // <2,6,u,2>: Cost 3 vsldoi4 <3,2,6,u>, <2,6,u,7>
-  3356322150U, // <2,6,u,3>: Cost 3 vmrglw LHS, <3,2,6,3>
-  3710741814U, // <2,6,u,4>: Cost 3 vsldoi4 <3,2,6,u>, RHS
-  3772233882U, // <2,6,u,5>: Cost 3 vsldoi8 <2,3,2,6>, RHS
-  2330358584U, // <2,6,u,6>: Cost 2 vmrglw LHS, <6,6,6,6>
-  1208839478U, // <2,6,u,7>: Cost 1 vmrglw LHS, RHS
-  1208839479U, // <2,6,u,u>: Cost 1 vmrglw LHS, RHS
-  3740606566U, // <2,7,0,0>: Cost 3 vsldoi4 <u,2,7,0>, LHS
-  2793362426U, // <2,7,0,1>: Cost 2 vsldoi12 <7,0,1,2>, <7,0,1,2>
+  2792403845U, // <2,6,7,6>: Cost 3 vsldoi12 <6,7,6,2>, <6,7,6,2>
+  2297834806U, // <2,6,7,7>: Cost 3 vmrglw <2,6,2,7>, RHS
+  2297834807U, // <2,6,7,u>: Cost 3 vmrglw <2,6,2,7>, RHS
+  2636996710U, // <2,6,u,0>: Cost 3 vsldoi4 <3,2,6,u>, LHS
+  2698491694U, // <2,6,u,1>: Cost 3 vsldoi8 <2,3,2,6>, LHS
+  2636998631U, // <2,6,u,2>: Cost 3 vsldoi4 <3,2,6,u>, <2,6,u,7>
+  2282580326U, // <2,6,u,3>: Cost 3 vmrglw LHS, <3,2,6,3>
+  2636999990U, // <2,6,u,4>: Cost 3 vsldoi4 <3,2,6,u>, RHS
+  2698492058U, // <2,6,u,5>: Cost 3 vsldoi8 <2,3,2,6>, RHS
+  1256616760U, // <2,6,u,6>: Cost 2 vmrglw LHS, <6,6,6,6>
+  135097654U,  // <2,6,u,7>: Cost 1 vmrglw LHS, RHS
+  135097655U,  // <2,6,u,u>: Cost 1 vmrglw LHS, RHS
+  2666864742U, // <2,7,0,0>: Cost 3 vsldoi4 <u,2,7,0>, LHS
+  1719620602U, // <2,7,0,1>: Cost 2 vsldoi12 <7,0,1,2>, <7,0,1,2>
   3768254637U, // <2,7,0,2>: Cost 4 vsldoi8 <1,6,2,7>, <0,2,1,2>
   3393417722U, // <2,7,0,3>: Cost 4 vmrglw <6,3,2,0>, <6,2,7,3>
-  3740609846U, // <2,7,0,4>: Cost 3 vsldoi4 <u,2,7,0>, RHS
+  2666868022U, // <2,7,0,4>: Cost 3 vsldoi4 <u,2,7,0>, RHS
   3867104290U, // <2,7,0,5>: Cost 4 vsldoi12 <7,0,1,2>, <7,0,5,6>
   3728667127U, // <2,7,0,6>: Cost 4 vsldoi4 <6,2,7,0>, <6,2,7,0>
-  3740611641U, // <2,7,0,7>: Cost 3 vsldoi4 <u,2,7,0>, <7,0,u,2>
-  2793878585U, // <2,7,0,u>: Cost 2 vsldoi12 <7,0,u,2>, <7,0,u,2>
+  2666869817U, // <2,7,0,7>: Cost 3 vsldoi4 <u,2,7,0>, <7,0,u,2>
+  1720136761U, // <2,7,0,u>: Cost 2 vsldoi12 <7,0,u,2>, <7,0,u,2>
   3728670822U, // <2,7,1,0>: Cost 4 vsldoi4 <6,2,7,1>, LHS
   3774227252U, // <2,7,1,1>: Cost 4 vsldoi8 <2,6,2,7>, <1,1,1,1>
   3774227350U, // <2,7,1,2>: Cost 4 vsldoi8 <2,6,2,7>, <1,2,3,0>
-  3396743674U, // <2,7,1,3>: Cost 3 vmrglw <6,u,2,1>, <6,2,7,3>
+  2323001850U, // <2,7,1,3>: Cost 3 vmrglw <6,u,2,1>, <6,2,7,3>
   3728674102U, // <2,7,1,4>: Cost 4 vsldoi4 <6,2,7,1>, RHS
   3774227567U, // <2,7,1,5>: Cost 5 vsldoi8 <2,6,2,7>, <1,5,0,1>
-  3768255704U, // <2,7,1,6>: Cost 3 vsldoi8 <1,6,2,7>, <1,6,2,7>
+  2694513880U, // <2,7,1,6>: Cost 3 vsldoi8 <1,6,2,7>, <1,6,2,7>
   3396744002U, // <2,7,1,7>: Cost 4 vmrglw <6,u,2,1>, <6,6,7,7>
-  3396743674U, // <2,7,1,u>: Cost 3 vmrglw <6,u,2,1>, <6,2,7,3>
-  3728679014U, // <2,7,2,0>: Cost 3 vsldoi4 <6,2,7,2>, LHS
+  2323001850U, // <2,7,1,u>: Cost 3 vmrglw <6,u,2,1>, <6,2,7,3>
+  2654937190U, // <2,7,2,0>: Cost 3 vsldoi4 <6,2,7,2>, LHS
   3728679732U, // <2,7,2,1>: Cost 4 vsldoi4 <6,2,7,2>, <1,1,1,1>
-  3774228072U, // <2,7,2,2>: Cost 3 vsldoi8 <2,6,2,7>, <2,2,2,2>
-  3395424762U, // <2,7,2,3>: Cost 3 vmrglw <6,6,2,2>, <6,2,7,3>
-  3728682294U, // <2,7,2,4>: Cost 3 vsldoi4 <6,2,7,2>, RHS
+  2700486248U, // <2,7,2,2>: Cost 3 vsldoi8 <2,6,2,7>, <2,2,2,2>
+  2321682938U, // <2,7,2,3>: Cost 3 vmrglw <6,6,2,2>, <6,2,7,3>
+  2654940470U, // <2,7,2,4>: Cost 3 vsldoi4 <6,2,7,2>, RHS
   3859584196U, // <2,7,2,5>: Cost 4 vsldoi12 <5,6,7,2>, <7,2,5,6>
-  3774228401U, // <2,7,2,6>: Cost 3 vsldoi8 <2,6,2,7>, <2,6,2,7>
-  3301774956U, // <2,7,2,7>: Cost 3 vmrghw <2,2,2,2>, <7,7,7,7>
-  3775555667U, // <2,7,2,u>: Cost 3 vsldoi8 <2,u,2,7>, <2,u,2,7>
-  2654945382U, // <2,7,3,0>: Cost 2 vsldoi4 <6,2,7,3>, LHS
-  3728687924U, // <2,7,3,1>: Cost 3 vsldoi4 <6,2,7,3>, <1,1,1,1>
-  3710773178U, // <2,7,3,2>: Cost 3 vsldoi4 <3,2,7,3>, <2,6,3,7>
-  2330317306U, // <2,7,3,3>: Cost 2 vmrglw LHS, <6,2,7,3>
-  2654948662U, // <2,7,3,4>: Cost 2 vsldoi4 <6,2,7,3>, RHS
-  3728691204U, // <2,7,3,5>: Cost 3 vsldoi4 <6,2,7,3>, <5,5,5,5>
-  2654949882U, // <2,7,3,6>: Cost 2 vsldoi4 <6,2,7,3>, <6,2,7,3>
-  2330317634U, // <2,7,3,7>: Cost 2 vmrglw LHS, <6,6,7,7>
-  2654951214U, // <2,7,3,u>: Cost 2 vsldoi4 <6,2,7,3>, LHS
+  2700486577U, // <2,7,2,6>: Cost 3 vsldoi8 <2,6,2,7>, <2,6,2,7>
+  2228033132U, // <2,7,2,7>: Cost 3 vmrghw <2,2,2,2>, <7,7,7,7>
+  2701813843U, // <2,7,2,u>: Cost 3 vsldoi8 <2,u,2,7>, <2,u,2,7>
+  1581203558U, // <2,7,3,0>: Cost 2 vsldoi4 <6,2,7,3>, LHS
+  2654946100U, // <2,7,3,1>: Cost 3 vsldoi4 <6,2,7,3>, <1,1,1,1>
+  2637031354U, // <2,7,3,2>: Cost 3 vsldoi4 <3,2,7,3>, <2,6,3,7>
+  1256575482U, // <2,7,3,3>: Cost 2 vmrglw LHS, <6,2,7,3>
+  1581206838U, // <2,7,3,4>: Cost 2 vsldoi4 <6,2,7,3>, RHS
+  2654949380U, // <2,7,3,5>: Cost 3 vsldoi4 <6,2,7,3>, <5,5,5,5>
+  1581208058U, // <2,7,3,6>: Cost 2 vsldoi4 <6,2,7,3>, <6,2,7,3>
+  1256575810U, // <2,7,3,7>: Cost 2 vmrglw LHS, <6,6,7,7>
+  1581209390U, // <2,7,3,u>: Cost 2 vsldoi4 <6,2,7,3>, LHS
   3728695398U, // <2,7,4,0>: Cost 4 vsldoi4 <6,2,7,4>, LHS
   3869758782U, // <2,7,4,1>: Cost 4 vsldoi12 <7,4,1,2>, <7,4,1,2>
   3728696936U, // <2,7,4,2>: Cost 4 vsldoi4 <6,2,7,4>, <2,2,2,2>
   3393450490U, // <2,7,4,3>: Cost 4 vmrglw <6,3,2,4>, <6,2,7,3>
   3728698678U, // <2,7,4,4>: Cost 4 vsldoi4 <6,2,7,4>, RHS
-  3774229814U, // <2,7,4,5>: Cost 3 vsldoi8 <2,6,2,7>, RHS
+  2700487990U, // <2,7,4,5>: Cost 3 vsldoi8 <2,6,2,7>, RHS
   3728699899U, // <2,7,4,6>: Cost 4 vsldoi4 <6,2,7,4>, <6,2,7,4>
   3867104626U, // <2,7,4,7>: Cost 4 vsldoi12 <7,0,1,2>, <7,4,7,0>
-  3774230057U, // <2,7,4,u>: Cost 3 vsldoi8 <2,6,2,7>, RHS
+  2700488233U, // <2,7,4,u>: Cost 3 vsldoi8 <2,6,2,7>, RHS
   3855160709U, // <2,7,5,0>: Cost 4 vsldoi12 <5,0,1,2>, <7,5,0,1>
   3728704406U, // <2,7,5,1>: Cost 4 vsldoi4 <6,2,7,5>, <1,2,3,0>
   3370233956U, // <2,7,5,2>: Cost 4 vmrglw <2,4,2,5>, <5,6,7,2>
-  3394122234U, // <2,7,5,3>: Cost 3 vmrglw <6,4,2,5>, <6,2,7,3>
+  2320380410U, // <2,7,5,3>: Cost 3 vmrglw <6,4,2,5>, <6,2,7,3>
   3728706870U, // <2,7,5,4>: Cost 4 vsldoi4 <6,2,7,5>, RHS
   3867104694U, // <2,7,5,5>: Cost 4 vsldoi12 <7,0,1,2>, <7,5,5,5>
   3792146492U, // <2,7,5,6>: Cost 4 vsldoi8 <5,6,2,7>, <5,6,2,7>
   3394122562U, // <2,7,5,7>: Cost 4 vmrglw <6,4,2,5>, <6,6,7,7>
-  3394122234U, // <2,7,5,u>: Cost 3 vmrglw <6,4,2,5>, <6,2,7,3>
-  3304543226U, // <2,7,6,0>: Cost 3 vmrghw <2,6,3,7>, <7,0,1,2>
+  2320380410U, // <2,7,5,u>: Cost 3 vmrglw <6,4,2,5>, <6,2,7,3>
+  2230801402U, // <2,7,6,0>: Cost 3 vmrghw <2,6,3,7>, <7,0,1,2>
   3768258984U, // <2,7,6,1>: Cost 4 vsldoi8 <1,6,2,7>, <6,1,7,2>
-  3804090874U, // <2,7,6,2>: Cost 3 vsldoi8 <7,6,2,7>, <6,2,7,3>
+  2730349050U, // <2,7,6,2>: Cost 3 vsldoi8 <7,6,2,7>, <6,2,7,3>
   3372894575U, // <2,7,6,3>: Cost 4 vmrglw <2,u,2,6>, <3,2,7,3>
-  3304543590U, // <2,7,6,4>: Cost 3 vmrghw <2,6,3,7>, <7,4,5,6>
+  2230801766U, // <2,7,6,4>: Cost 3 vmrghw <2,6,3,7>, <7,4,5,6>
   3304543670U, // <2,7,6,5>: Cost 4 vmrghw <2,6,3,7>, <7,5,5,5>
   3728716285U, // <2,7,6,6>: Cost 4 vsldoi4 <6,2,7,6>, <6,2,7,6>
-  3304543852U, // <2,7,6,7>: Cost 3 vmrghw <2,6,3,7>, <7,7,7,7>
-  3804090874U, // <2,7,6,u>: Cost 3 vsldoi8 <7,6,2,7>, <6,2,7,3>
-  3867104807U, // <2,7,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <7,7,0,1>
+  2230802028U, // <2,7,6,7>: Cost 3 vmrghw <2,6,3,7>, <7,7,7,7>
+  2730349050U, // <2,7,6,u>: Cost 3 vsldoi8 <7,6,2,7>, <6,2,7,3>
+  2793362983U, // <2,7,7,0>: Cost 3 vsldoi12 <7,0,1,2>, <7,7,0,1>
   3728721112U, // <2,7,7,1>: Cost 4 vsldoi4 <6,2,7,7>, <1,6,2,7>
   3371574933U, // <2,7,7,2>: Cost 4 vmrglw <2,6,2,7>, <2,2,7,2>
-  3401437690U, // <2,7,7,3>: Cost 3 vmrglw <7,6,2,7>, <6,2,7,3>
+  2327695866U, // <2,7,7,3>: Cost 3 vmrglw <7,6,2,7>, <6,2,7,3>
   3728723254U, // <2,7,7,4>: Cost 4 vsldoi4 <6,2,7,7>, RHS
   3371574855U, // <2,7,7,5>: Cost 5 vmrglw <2,6,2,7>, <2,1,7,5>
-  3804091886U, // <2,7,7,6>: Cost 3 vsldoi8 <7,6,2,7>, <7,6,2,7>
-  3867104876U, // <2,7,7,7>: Cost 3 vsldoi12 <7,0,1,2>, <7,7,7,7>
-  3872413295U, // <2,7,7,u>: Cost 3 vsldoi12 <7,u,1,2>, <7,7,u,1>
-  2654986342U, // <2,7,u,0>: Cost 2 vsldoi4 <6,2,7,u>, LHS
-  2798671490U, // <2,7,u,1>: Cost 2 vsldoi12 <7,u,1,2>, <7,u,1,2>
-  3710814138U, // <2,7,u,2>: Cost 3 vsldoi4 <3,2,7,u>, <2,6,3,7>
-  2330358266U, // <2,7,u,3>: Cost 2 vmrglw LHS, <6,2,7,3>
-  2654989622U, // <2,7,u,4>: Cost 2 vsldoi4 <6,2,7,u>, RHS
-  3774232730U, // <2,7,u,5>: Cost 3 vsldoi8 <2,6,2,7>, RHS
-  2654990847U, // <2,7,u,6>: Cost 2 vsldoi4 <6,2,7,u>, <6,2,7,u>
-  2330358594U, // <2,7,u,7>: Cost 2 vmrglw LHS, <6,6,7,7>
-  2654992174U, // <2,7,u,u>: Cost 2 vsldoi4 <6,2,7,u>, LHS
-  2685231104U, // <2,u,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
-  1611489387U, // <2,u,0,1>: Cost 1 vsldoi8 LHS, LHS
-  3758973101U, // <2,u,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
-  3758973180U, // <2,u,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
-  2685231442U, // <2,u,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
-  3300505754U, // <2,u,0,5>: Cost 3 vmrghw <2,0,3,0>, RHS
-  3806749174U, // <2,u,0,6>: Cost 3 vsldoi8 LHS, <0,6,1,7>
-  3734713561U, // <2,u,0,7>: Cost 3 vsldoi4 <7,2,u,0>, <7,2,u,0>
-  1611489949U, // <2,u,0,u>: Cost 1 vsldoi8 LHS, LHS
-  3763618532U, // <2,u,1,0>: Cost 3 vsldoi8 LHS, <1,0,1,2>
-  2685231924U, // <2,u,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
-  2685232022U, // <2,u,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
-  3366879388U, // <2,u,1,3>: Cost 3 vmrglw <1,u,2,1>, LHS
-  3763618896U, // <2,u,1,4>: Cost 3 vsldoi8 LHS, <1,4,5,6>
-  3763618927U, // <2,u,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
-  3763619023U, // <2,u,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
-  3366882632U, // <2,u,1,7>: Cost 3 vmrglw <1,u,2,1>, RHS
-  2689877372U, // <2,u,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
-  2630680678U, // <2,u,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
-  2228033326U, // <2,u,2,1>: Cost 2 vmrghw <2,2,2,2>, LHS
-  1410121830U, // <2,u,2,2>: Cost 1 vspltisw2 LHS
-  2685232806U, // <2,u,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
-  2630683958U, // <2,u,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
-  2228033690U, // <2,u,2,5>: Cost 2 vmrghw <2,2,2,2>, RHS
-  2685233082U, // <2,u,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
-  2295139656U, // <2,u,2,7>: Cost 2 vmrglw <2,2,2,2>, RHS
-  1410121830U, // <2,u,2,u>: Cost 1 vspltisw2 LHS
-  2685233302U, // <2,u,3,0>: Cost 2 vsldoi8 LHS, <3,0,1,2>
-  2287181897U, // <2,u,3,1>: Cost 2 vmrglw LHS, <0,0,u,1>
-  2287184085U, // <2,u,3,2>: Cost 2 vmrglw LHS, <3,0,u,2>
-  1208795292U, // <2,u,3,3>: Cost 1 vmrglw LHS, LHS
-  2685233666U, // <2,u,3,4>: Cost 2 vsldoi8 LHS, <3,4,5,6>
-  2287182225U, // <2,u,3,5>: Cost 2 vmrglw LHS, <0,4,u,5>
-  2287184413U, // <2,u,3,6>: Cost 2 vmrglw LHS, <3,4,u,6>
-  1208798536U, // <2,u,3,7>: Cost 1 vmrglw LHS, RHS
-  1208795297U, // <2,u,3,u>: Cost 1 vmrglw LHS, LHS
-  2625167462U, // <2,u,4,0>: Cost 2 vsldoi4 <1,2,u,4>, LHS
-  2625168327U, // <2,u,4,1>: Cost 2 vsldoi4 <1,2,u,4>, <1,2,u,4>
-  3698910824U, // <2,u,4,2>: Cost 3 vsldoi4 <1,2,u,4>, <2,2,2,2>
-  3698911382U, // <2,u,4,3>: Cost 3 vsldoi4 <1,2,u,4>, <3,0,1,2>
-  2625170742U, // <2,u,4,4>: Cost 2 vsldoi4 <1,2,u,4>, RHS
-  1611492662U, // <2,u,4,5>: Cost 1 vsldoi8 LHS, RHS
-  3806752121U, // <2,u,4,6>: Cost 3 vsldoi8 LHS, <4,6,5,2>
-  3368897864U, // <2,u,4,7>: Cost 3 vmrglw <2,2,2,4>, RHS
-  1611492905U, // <2,u,4,u>: Cost 1 vsldoi8 LHS, RHS
-  3763621448U, // <2,u,5,0>: Cost 3 vsldoi8 LHS, <5,0,1,2>
-  3303872302U, // <2,u,5,1>: Cost 3 vmrghw <2,5,3,6>, LHS
-  3704891041U, // <2,u,5,2>: Cost 3 vsldoi4 <2,2,u,5>, <2,2,u,5>
-  3364257948U, // <2,u,5,3>: Cost 3 vmrglw <1,4,2,5>, LHS
-  3763621812U, // <2,u,5,4>: Cost 3 vsldoi8 LHS, <5,4,5,6>
-  2733010948U, // <2,u,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
-  2764904602U, // <2,u,5,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
-  3364261192U, // <2,u,5,7>: Cost 3 vmrglw <1,4,2,5>, RHS
-  2764904620U, // <2,u,5,u>: Cost 2 vsldoi12 <2,2,2,2>, RHS
-  3304543955U, // <2,u,6,0>: Cost 3 vmrghw <2,6,3,7>, <u,0,1,2>
-  2230802222U, // <2,u,6,1>: Cost 2 vmrghw <2,6,3,7>, LHS
-  2733011450U, // <2,u,6,2>: Cost 2 vsldoi8 LHS, <6,2,7,3>
-  3838646480U, // <2,u,6,3>: Cost 3 vsldoi12 <2,2,2,2>, <u,6,3,7>
-  3304544319U, // <2,u,6,4>: Cost 3 vmrghw <2,6,3,7>, <u,4,5,6>
-  2230802586U, // <2,u,6,5>: Cost 2 vmrghw <2,6,3,7>, RHS
-  2733011768U, // <2,u,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
-  2733011790U, // <2,u,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
-  2230802789U, // <2,u,6,u>: Cost 2 vmrghw <2,6,3,7>, LHS
-  2733011962U, // <2,u,7,0>: Cost 2 vsldoi8 LHS, <7,0,1,2>
-  3800781914U, // <2,u,7,1>: Cost 3 vsldoi8 <7,1,2,u>, <7,1,2,u>
-  3801445547U, // <2,u,7,2>: Cost 3 vsldoi8 <7,2,2,u>, <7,2,2,u>
-  3371573404U, // <2,u,7,3>: Cost 3 vmrglw <2,6,2,7>, LHS
-  2733012326U, // <2,u,7,4>: Cost 2 vsldoi8 LHS, <7,4,5,6>
-  3806754230U, // <2,u,7,5>: Cost 3 vsldoi8 LHS, <7,5,5,5>
-  3804100079U, // <2,u,7,6>: Cost 3 vsldoi8 <7,6,2,u>, <7,6,2,u>
-  2733012588U, // <2,u,7,7>: Cost 2 vsldoi8 LHS, <7,7,7,7>
-  2733012610U, // <2,u,7,u>: Cost 2 vsldoi8 LHS, <7,u,1,2>
-  2287223747U, // <2,u,u,0>: Cost 2 vmrglw LHS, <1,2,u,0>
-  1611495214U, // <2,u,u,1>: Cost 1 vsldoi8 LHS, LHS
-  1410121830U, // <2,u,u,2>: Cost 1 vspltisw2 LHS
-  1208836252U, // <2,u,u,3>: Cost 1 vmrglw LHS, LHS
-  2287223751U, // <2,u,u,4>: Cost 2 vmrglw LHS, <1,2,u,4>
-  1611495578U, // <2,u,u,5>: Cost 1 vsldoi8 LHS, RHS
-  2282580509U, // <2,u,u,6>: Cost 2 vmrglw LHS, <3,4,u,6>
-  1208839496U, // <2,u,u,7>: Cost 1 vmrglw LHS, RHS
-  1208836257U, // <2,u,u,u>: Cost 1 vmrglw LHS, LHS
-  2752299008U, // <3,0,0,0>: Cost 2 vsldoi12 LHS, <0,0,0,0>
-  2752299018U, // <3,0,0,1>: Cost 2 vsldoi12 LHS, <0,0,1,1>
-  3704923813U, // <3,0,0,2>: Cost 3 vsldoi4 <2,3,0,0>, <2,3,0,0>
-  3362965808U, // <3,0,0,3>: Cost 3 vmrglw <1,2,3,0>, <3,2,0,3>
-  3830685733U, // <3,0,0,4>: Cost 3 vsldoi12 LHS, <0,0,4,1>
+  2730350062U, // <2,7,7,6>: Cost 3 vsldoi8 <7,6,2,7>, <7,6,2,7>
+  2793363052U, // <2,7,7,7>: Cost 3 vsldoi12 <7,0,1,2>, <7,7,7,7>
+  2798671471U, // <2,7,7,u>: Cost 3 vsldoi12 <7,u,1,2>, <7,7,u,1>
+  1581244518U, // <2,7,u,0>: Cost 2 vsldoi4 <6,2,7,u>, LHS
+  1724929666U, // <2,7,u,1>: Cost 2 vsldoi12 <7,u,1,2>, <7,u,1,2>
+  2637072314U, // <2,7,u,2>: Cost 3 vsldoi4 <3,2,7,u>, <2,6,3,7>
+  1256616442U, // <2,7,u,3>: Cost 2 vmrglw LHS, <6,2,7,3>
+  1581247798U, // <2,7,u,4>: Cost 2 vsldoi4 <6,2,7,u>, RHS
+  2700490906U, // <2,7,u,5>: Cost 3 vsldoi8 <2,6,2,7>, RHS
+  1581249023U, // <2,7,u,6>: Cost 2 vsldoi4 <6,2,7,u>, <6,2,7,u>
+  1256616770U, // <2,7,u,7>: Cost 2 vmrglw LHS, <6,6,7,7>
+  1581250350U, // <2,7,u,u>: Cost 2 vsldoi4 <6,2,7,u>, LHS
+  1611489280U, // <2,u,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
+  537747563U,  // <2,u,0,1>: Cost 1 vsldoi8 LHS, LHS
+  2685231277U, // <2,u,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
+  2685231356U, // <2,u,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
+  1611489618U, // <2,u,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
+  2226763930U, // <2,u,0,5>: Cost 3 vmrghw <2,0,3,0>, RHS
+  2733007350U, // <2,u,0,6>: Cost 3 vsldoi8 LHS, <0,6,1,7>
+  2660971737U, // <2,u,0,7>: Cost 3 vsldoi4 <7,2,u,0>, <7,2,u,0>
+  537748125U,  // <2,u,0,u>: Cost 1 vsldoi8 LHS, LHS
+  2689876708U, // <2,u,1,0>: Cost 3 vsldoi8 LHS, <1,0,1,2>
+  1611490100U, // <2,u,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
+  1611490198U, // <2,u,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
+  2293137564U, // <2,u,1,3>: Cost 3 vmrglw <1,u,2,1>, LHS
+  2689877072U, // <2,u,1,4>: Cost 3 vsldoi8 LHS, <1,4,5,6>
+  2689877103U, // <2,u,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
+  2689877199U, // <2,u,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
+  2293140808U, // <2,u,1,7>: Cost 3 vmrglw <1,u,2,1>, RHS
+  1616135548U, // <2,u,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
+  1556938854U, // <2,u,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
+  1154291502U, // <2,u,2,1>: Cost 2 vmrghw <2,2,2,2>, LHS
+  336380006U,  // <2,u,2,2>: Cost 1 vspltisw2 LHS
+  1611490982U, // <2,u,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
+  1556942134U, // <2,u,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
+  1154291866U, // <2,u,2,5>: Cost 2 vmrghw <2,2,2,2>, RHS
+  1611491258U, // <2,u,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
+  1221397832U, // <2,u,2,7>: Cost 2 vmrglw <2,2,2,2>, RHS
+  336380006U,  // <2,u,2,u>: Cost 1 vspltisw2 LHS
+  1611491478U, // <2,u,3,0>: Cost 2 vsldoi8 LHS, <3,0,1,2>
+  1213440073U, // <2,u,3,1>: Cost 2 vmrglw LHS, <0,0,u,1>
+  1213442261U, // <2,u,3,2>: Cost 2 vmrglw LHS, <3,0,u,2>
+  135053468U,  // <2,u,3,3>: Cost 1 vmrglw LHS, LHS
+  1611491842U, // <2,u,3,4>: Cost 2 vsldoi8 LHS, <3,4,5,6>
+  1213440401U, // <2,u,3,5>: Cost 2 vmrglw LHS, <0,4,u,5>
+  1213442589U, // <2,u,3,6>: Cost 2 vmrglw LHS, <3,4,u,6>
+  135056712U,  // <2,u,3,7>: Cost 1 vmrglw LHS, RHS
+  135053473U,  // <2,u,3,u>: Cost 1 vmrglw LHS, LHS
+  1551425638U, // <2,u,4,0>: Cost 2 vsldoi4 <1,2,u,4>, LHS
+  1551426503U, // <2,u,4,1>: Cost 2 vsldoi4 <1,2,u,4>, <1,2,u,4>
+  2625169000U, // <2,u,4,2>: Cost 3 vsldoi4 <1,2,u,4>, <2,2,2,2>
+  2625169558U, // <2,u,4,3>: Cost 3 vsldoi4 <1,2,u,4>, <3,0,1,2>
+  1551428918U, // <2,u,4,4>: Cost 2 vsldoi4 <1,2,u,4>, RHS
+  537750838U,  // <2,u,4,5>: Cost 1 vsldoi8 LHS, RHS
+  2733010297U, // <2,u,4,6>: Cost 3 vsldoi8 LHS, <4,6,5,2>
+  2295156040U, // <2,u,4,7>: Cost 3 vmrglw <2,2,2,4>, RHS
+  537751081U,  // <2,u,4,u>: Cost 1 vsldoi8 LHS, RHS
+  2689879624U, // <2,u,5,0>: Cost 3 vsldoi8 LHS, <5,0,1,2>
+  2230130478U, // <2,u,5,1>: Cost 3 vmrghw <2,5,3,6>, LHS
+  2631149217U, // <2,u,5,2>: Cost 3 vsldoi4 <2,2,u,5>, <2,2,u,5>
+  2290516124U, // <2,u,5,3>: Cost 3 vmrglw <1,4,2,5>, LHS
+  2689879988U, // <2,u,5,4>: Cost 3 vsldoi8 LHS, <5,4,5,6>
+  1659269124U, // <2,u,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
+  1691162778U, // <2,u,5,6>: Cost 2 vsldoi12 <2,2,2,2>, RHS
+  2290519368U, // <2,u,5,7>: Cost 3 vmrglw <1,4,2,5>, RHS
+  1691162796U, // <2,u,5,u>: Cost 2 vsldoi12 <2,2,2,2>, RHS
+  2230802131U, // <2,u,6,0>: Cost 3 vmrghw <2,6,3,7>, <u,0,1,2>
+  1157060398U, // <2,u,6,1>: Cost 2 vmrghw <2,6,3,7>, LHS
+  1659269626U, // <2,u,6,2>: Cost 2 vsldoi8 LHS, <6,2,7,3>
+  2764904656U, // <2,u,6,3>: Cost 3 vsldoi12 <2,2,2,2>, <u,6,3,7>
+  2230802495U, // <2,u,6,4>: Cost 3 vmrghw <2,6,3,7>, <u,4,5,6>
+  1157060762U, // <2,u,6,5>: Cost 2 vmrghw <2,6,3,7>, RHS
+  1659269944U, // <2,u,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
+  1659269966U, // <2,u,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
+  1157060965U, // <2,u,6,u>: Cost 2 vmrghw <2,6,3,7>, LHS
+  1659270138U, // <2,u,7,0>: Cost 2 vsldoi8 LHS, <7,0,1,2>
+  2727040090U, // <2,u,7,1>: Cost 3 vsldoi8 <7,1,2,u>, <7,1,2,u>
+  2727703723U, // <2,u,7,2>: Cost 3 vsldoi8 <7,2,2,u>, <7,2,2,u>
+  2297831580U, // <2,u,7,3>: Cost 3 vmrglw <2,6,2,7>, LHS
+  1659270502U, // <2,u,7,4>: Cost 2 vsldoi8 LHS, <7,4,5,6>
+  2733012406U, // <2,u,7,5>: Cost 3 vsldoi8 LHS, <7,5,5,5>
+  2730358255U, // <2,u,7,6>: Cost 3 vsldoi8 <7,6,2,u>, <7,6,2,u>
+  1659270764U, // <2,u,7,7>: Cost 2 vsldoi8 LHS, <7,7,7,7>
+  1659270786U, // <2,u,7,u>: Cost 2 vsldoi8 LHS, <7,u,1,2>
+  1213481923U, // <2,u,u,0>: Cost 2 vmrglw LHS, <1,2,u,0>
+  537753390U,  // <2,u,u,1>: Cost 1 vsldoi8 LHS, LHS
+  336380006U,  // <2,u,u,2>: Cost 1 vspltisw2 LHS
+  135094428U,  // <2,u,u,3>: Cost 1 vmrglw LHS, LHS
+  1213481927U, // <2,u,u,4>: Cost 2 vmrglw LHS, <1,2,u,4>
+  537753754U,  // <2,u,u,5>: Cost 1 vsldoi8 LHS, RHS
+  1208838685U, // <2,u,u,6>: Cost 2 vmrglw LHS, <3,4,u,6>
+  135097672U,  // <2,u,u,7>: Cost 1 vmrglw LHS, RHS
+  135094433U,  // <2,u,u,u>: Cost 1 vmrglw LHS, LHS
+  1678557184U, // <3,0,0,0>: Cost 2 vsldoi12 LHS, <0,0,0,0>
+  1678557194U, // <3,0,0,1>: Cost 2 vsldoi12 LHS, <0,0,1,1>
+  2631181989U, // <3,0,0,2>: Cost 3 vsldoi4 <2,3,0,0>, <2,3,0,0>
+  2289223984U, // <3,0,0,3>: Cost 3 vmrglw <1,2,3,0>, <3,2,0,3>
+  2756943909U, // <3,0,0,4>: Cost 3 vsldoi12 LHS, <0,0,4,1>
   3362965729U, // <3,0,0,5>: Cost 4 vmrglw <1,2,3,0>, <3,1,0,5>
   3362966054U, // <3,0,0,6>: Cost 4 vmrglw <1,2,3,0>, <3,5,0,6>
-  3362966136U, // <3,0,0,7>: Cost 3 vmrglw <1,2,3,0>, <3,6,0,7>
-  2756943945U, // <3,0,0,u>: Cost 2 vsldoi12 LHS, <0,0,u,1>
-  2631188582U, // <3,0,1,0>: Cost 2 vsldoi4 <2,3,0,1>, LHS
-  3826483291U, // <3,0,1,1>: Cost 3 vsldoi12 LHS, <0,1,1,1>
-  1678557286U, // <3,0,1,2>: Cost 1 vsldoi12 LHS, LHS
-  3704932500U, // <3,0,1,3>: Cost 3 vsldoi4 <2,3,0,1>, <3,0,1,0>
-  2631191862U, // <3,0,1,4>: Cost 2 vsldoi4 <2,3,0,1>, RHS
-  3740766212U, // <3,0,1,5>: Cost 3 vsldoi4 <u,3,0,1>, <5,5,5,5>
-  3873816718U, // <3,0,1,6>: Cost 3 vsldoi12 LHS, <0,1,6,7>
-  3734795491U, // <3,0,1,7>: Cost 3 vsldoi4 <7,3,0,1>, <7,3,0,1>
-  1678557340U, // <3,0,1,u>: Cost 1 vsldoi12 LHS, LHS
-  3770262989U, // <3,0,2,0>: Cost 3 vsldoi8 <2,0,3,0>, <2,0,3,0>
-  3826483373U, // <3,0,2,1>: Cost 3 vsldoi12 LHS, <0,2,1,2>
-  3765618280U, // <3,0,2,2>: Cost 3 vsldoi8 <1,2,3,0>, <2,2,2,2>
-  3765618342U, // <3,0,2,3>: Cost 3 vsldoi8 <1,2,3,0>, <2,3,0,1>
+  2289224312U, // <3,0,0,7>: Cost 3 vmrglw <1,2,3,0>, <3,6,0,7>
+  1683202121U, // <3,0,0,u>: Cost 2 vsldoi12 LHS, <0,0,u,1>
+  1557446758U, // <3,0,1,0>: Cost 2 vsldoi4 <2,3,0,1>, LHS
+  2752741467U, // <3,0,1,1>: Cost 3 vsldoi12 LHS, <0,1,1,1>
+  604815462U,  // <3,0,1,2>: Cost 1 vsldoi12 LHS, LHS
+  2631190676U, // <3,0,1,3>: Cost 3 vsldoi4 <2,3,0,1>, <3,0,1,0>
+  1557450038U, // <3,0,1,4>: Cost 2 vsldoi4 <2,3,0,1>, RHS
+  2667024388U, // <3,0,1,5>: Cost 3 vsldoi4 <u,3,0,1>, <5,5,5,5>
+  2800074894U, // <3,0,1,6>: Cost 3 vsldoi12 LHS, <0,1,6,7>
+  2661053667U, // <3,0,1,7>: Cost 3 vsldoi4 <7,3,0,1>, <7,3,0,1>
+  604815516U,  // <3,0,1,u>: Cost 1 vsldoi12 LHS, LHS
+  2696521165U, // <3,0,2,0>: Cost 3 vsldoi8 <2,0,3,0>, <2,0,3,0>
+  2752741549U, // <3,0,2,1>: Cost 3 vsldoi12 LHS, <0,2,1,2>
+  2691876456U, // <3,0,2,2>: Cost 3 vsldoi8 <1,2,3,0>, <2,2,2,2>
+  2691876518U, // <3,0,2,3>: Cost 3 vsldoi8 <1,2,3,0>, <2,3,0,1>
   3830685895U, // <3,0,2,4>: Cost 4 vsldoi12 LHS, <0,2,4,1>
   3765618536U, // <3,0,2,5>: Cost 4 vsldoi8 <1,2,3,0>, <2,5,3,6>
-  3765618618U, // <3,0,2,6>: Cost 3 vsldoi8 <1,2,3,0>, <2,6,3,7>
-  3774908420U, // <3,0,2,7>: Cost 3 vsldoi8 <2,7,3,0>, <2,7,3,0>
-  3830685932U, // <3,0,2,u>: Cost 3 vsldoi12 LHS, <0,2,u,2>
-  3765618838U, // <3,0,3,0>: Cost 3 vsldoi8 <1,2,3,0>, <3,0,1,2>
-  2234744934U, // <3,0,3,1>: Cost 2 vmrghw <3,3,3,3>, LHS
-  3765618992U, // <3,0,3,2>: Cost 3 vsldoi8 <1,2,3,0>, <3,2,0,3>
-  3765619070U, // <3,0,3,3>: Cost 3 vsldoi8 <1,2,3,0>, <3,3,0,0>
-  3765619202U, // <3,0,3,4>: Cost 3 vsldoi8 <1,2,3,0>, <3,4,5,6>
+  2691876794U, // <3,0,2,6>: Cost 3 vsldoi8 <1,2,3,0>, <2,6,3,7>
+  2701166596U, // <3,0,2,7>: Cost 3 vsldoi8 <2,7,3,0>, <2,7,3,0>
+  2756944108U, // <3,0,2,u>: Cost 3 vsldoi12 LHS, <0,2,u,2>
+  2691877014U, // <3,0,3,0>: Cost 3 vsldoi8 <1,2,3,0>, <3,0,1,2>
+  1161003110U, // <3,0,3,1>: Cost 2 vmrghw <3,3,3,3>, LHS
+  2691877168U, // <3,0,3,2>: Cost 3 vsldoi8 <1,2,3,0>, <3,2,0,3>
+  2691877246U, // <3,0,3,3>: Cost 3 vsldoi8 <1,2,3,0>, <3,3,0,0>
+  2691877378U, // <3,0,3,4>: Cost 3 vsldoi8 <1,2,3,0>, <3,4,5,6>
   3765619238U, // <3,0,3,5>: Cost 4 vsldoi8 <1,2,3,0>, <3,5,0,6>
-  3765619320U, // <3,0,3,6>: Cost 3 vsldoi8 <1,2,3,0>, <3,6,0,7>
+  2691877496U, // <3,0,3,6>: Cost 3 vsldoi8 <1,2,3,0>, <3,6,0,7>
   3368962680U, // <3,0,3,7>: Cost 4 vmrglw <2,2,3,3>, <3,6,0,7>
-  2234745501U, // <3,0,3,u>: Cost 2 vmrghw <3,3,3,3>, LHS
-  3362996224U, // <3,0,4,0>: Cost 3 vmrglw <1,2,3,4>, <0,0,0,0>
-  2752299346U, // <3,0,4,1>: Cost 2 vsldoi12 LHS, <0,4,1,5>
-  3704956585U, // <3,0,4,2>: Cost 3 vsldoi4 <2,3,0,4>, <2,3,0,4>
-  3309322496U, // <3,0,4,3>: Cost 3 vmrghw <3,4,5,6>, <0,3,1,4>
-  3830686061U, // <3,0,4,4>: Cost 3 vsldoi12 LHS, <0,4,4,5>
-  2691878198U, // <3,0,4,5>: Cost 2 vsldoi8 <1,2,3,0>, RHS
+  1161003677U, // <3,0,3,u>: Cost 2 vmrghw <3,3,3,3>, LHS
+  2289254400U, // <3,0,4,0>: Cost 3 vmrglw <1,2,3,4>, <0,0,0,0>
+  1678557522U, // <3,0,4,1>: Cost 2 vsldoi12 LHS, <0,4,1,5>
+  2631214761U, // <3,0,4,2>: Cost 3 vsldoi4 <2,3,0,4>, <2,3,0,4>
+  2235580672U, // <3,0,4,3>: Cost 3 vmrghw <3,4,5,6>, <0,3,1,4>
+  2756944237U, // <3,0,4,4>: Cost 3 vsldoi12 LHS, <0,4,4,5>
+  1618136374U, // <3,0,4,5>: Cost 2 vsldoi8 <1,2,3,0>, RHS
   3309322742U, // <3,0,4,6>: Cost 4 vmrghw <3,4,5,6>, <0,6,1,7>
   3362998904U, // <3,0,4,7>: Cost 4 vmrglw <1,2,3,4>, <3,6,0,7>
-  2756944273U, // <3,0,4,u>: Cost 2 vsldoi12 LHS, <0,4,u,5>
+  1683202449U, // <3,0,4,u>: Cost 2 vsldoi12 LHS, <0,4,u,5>
   3765620296U, // <3,0,5,0>: Cost 4 vsldoi8 <1,2,3,0>, <5,0,1,2>
-  3826041251U, // <3,0,5,1>: Cost 3 vsldoi12 LHS, <0,5,1,5>
+  2752299427U, // <3,0,5,1>: Cost 3 vsldoi12 LHS, <0,5,1,5>
   3789508346U, // <3,0,5,2>: Cost 4 vsldoi8 <5,2,3,0>, <5,2,3,0>
   3403486842U, // <3,0,5,3>: Cost 4 vmrglw <u,0,3,5>, <7,u,0,3>
   3765620660U, // <3,0,5,4>: Cost 4 vsldoi8 <1,2,3,0>, <5,4,5,6>
-  3807424516U, // <3,0,5,5>: Cost 3 vsldoi8 <u,2,3,0>, <5,5,5,5>
-  3873817042U, // <3,0,5,6>: Cost 3 vsldoi12 LHS, <0,5,6,7>
+  2733682692U, // <3,0,5,5>: Cost 3 vsldoi8 <u,2,3,0>, <5,5,5,5>
+  2800075218U, // <3,0,5,6>: Cost 3 vsldoi12 LHS, <0,5,6,7>
   3873817044U, // <3,0,5,7>: Cost 4 vsldoi12 LHS, <0,5,7,0>
-  3873817058U, // <3,0,5,u>: Cost 3 vsldoi12 LHS, <0,5,u,5>
-  3826041325U, // <3,0,6,0>: Cost 3 vsldoi12 LHS, <0,6,0,7>
-  3310288998U, // <3,0,6,1>: Cost 3 vmrghw <3,6,0,7>, LHS
-  3807425018U, // <3,0,6,2>: Cost 3 vsldoi8 <u,2,3,0>, <6,2,7,3>
+  2800075234U, // <3,0,5,u>: Cost 3 vsldoi12 LHS, <0,5,u,5>
+  2752299501U, // <3,0,6,0>: Cost 3 vsldoi12 LHS, <0,6,0,7>
+  2236547174U, // <3,0,6,1>: Cost 3 vmrghw <3,6,0,7>, LHS
+  2733683194U, // <3,0,6,2>: Cost 3 vsldoi8 <u,2,3,0>, <6,2,7,3>
   3844473352U, // <3,0,6,3>: Cost 4 vsldoi12 <3,2,0,3>, <0,6,3,7>
   3310289234U, // <3,0,6,4>: Cost 4 vmrghw <3,6,0,7>, <0,4,1,5>
   3873817114U, // <3,0,6,5>: Cost 4 vsldoi12 LHS, <0,6,5,7>
-  3807425336U, // <3,0,6,6>: Cost 3 vsldoi8 <u,2,3,0>, <6,6,6,6>
-  3798799208U, // <3,0,6,7>: Cost 3 vsldoi8 <6,7,3,0>, <6,7,3,0>
-  3310289565U, // <3,0,6,u>: Cost 3 vmrghw <3,6,0,7>, LHS
-  3371646976U, // <3,0,7,0>: Cost 3 vmrglw <2,6,3,7>, <0,0,0,0>
-  3371648678U, // <3,0,7,1>: Cost 3 vmrglw <2,6,3,7>, <2,3,0,1>
-  3801453740U, // <3,0,7,2>: Cost 3 vsldoi8 <7,2,3,0>, <7,2,3,0>
+  2733683512U, // <3,0,6,6>: Cost 3 vsldoi8 <u,2,3,0>, <6,6,6,6>
+  2725057384U, // <3,0,6,7>: Cost 3 vsldoi8 <6,7,3,0>, <6,7,3,0>
+  2236547741U, // <3,0,6,u>: Cost 3 vmrghw <3,6,0,7>, LHS
+  2297905152U, // <3,0,7,0>: Cost 3 vmrglw <2,6,3,7>, <0,0,0,0>
+  2297906854U, // <3,0,7,1>: Cost 3 vmrglw <2,6,3,7>, <2,3,0,1>
+  2727711916U, // <3,0,7,2>: Cost 3 vsldoi8 <7,2,3,0>, <7,2,3,0>
   3371649328U, // <3,0,7,3>: Cost 4 vmrglw <2,6,3,7>, <3,2,0,3>
-  3807425894U, // <3,0,7,4>: Cost 3 vsldoi8 <u,2,3,0>, <7,4,5,6>
+  2733684070U, // <3,0,7,4>: Cost 3 vsldoi8 <u,2,3,0>, <7,4,5,6>
   3734843490U, // <3,0,7,5>: Cost 4 vsldoi4 <7,3,0,7>, <5,6,7,0>
   3798799895U, // <3,0,7,6>: Cost 4 vsldoi8 <6,7,3,0>, <7,6,7,3>
-  3807426156U, // <3,0,7,7>: Cost 3 vsldoi8 <u,2,3,0>, <7,7,7,7>
-  3371648685U, // <3,0,7,u>: Cost 3 vmrglw <2,6,3,7>, <2,3,0,u>
-  2631245926U, // <3,0,u,0>: Cost 2 vsldoi4 <2,3,0,u>, LHS
-  2752299666U, // <3,0,u,1>: Cost 2 vsldoi12 LHS, <0,u,1,1>
-  1678557853U, // <3,0,u,2>: Cost 1 vsldoi12 LHS, LHS
-  3765622716U, // <3,0,u,3>: Cost 3 vsldoi8 <1,2,3,0>, <u,3,0,1>
-  2631249206U, // <3,0,u,4>: Cost 2 vsldoi4 <2,3,0,u>, RHS
-  2691881114U, // <3,0,u,5>: Cost 2 vsldoi8 <1,2,3,0>, RHS
-  3765622992U, // <3,0,u,6>: Cost 3 vsldoi8 <1,2,3,0>, <u,6,3,7>
-  3734852842U, // <3,0,u,7>: Cost 3 vsldoi4 <7,3,0,u>, <7,3,0,u>
-  1678557907U, // <3,0,u,u>: Cost 1 vsldoi12 LHS, LHS
-  3693052156U, // <3,1,0,0>: Cost 3 vsldoi4 <0,3,1,0>, <0,3,1,0>
-  3830686436U, // <3,1,0,1>: Cost 3 vsldoi12 LHS, <1,0,1,2>
-  3362963548U, // <3,1,0,2>: Cost 3 vmrglw <1,2,3,0>, <0,1,1,2>
-  3693054102U, // <3,1,0,3>: Cost 3 vsldoi4 <0,3,1,0>, <3,0,1,2>
-  3693055286U, // <3,1,0,4>: Cost 3 vsldoi4 <0,3,1,0>, RHS
-  3362963794U, // <3,1,0,5>: Cost 3 vmrglw <1,2,3,0>, <0,4,1,5>
-  3306341592U, // <3,1,0,6>: Cost 3 vmrghw <3,0,1,2>, <1,6,2,7>
+  2733684332U, // <3,0,7,7>: Cost 3 vsldoi8 <u,2,3,0>, <7,7,7,7>
+  2297906861U, // <3,0,7,u>: Cost 3 vmrglw <2,6,3,7>, <2,3,0,u>
+  1557504102U, // <3,0,u,0>: Cost 2 vsldoi4 <2,3,0,u>, LHS
+  1678557842U, // <3,0,u,1>: Cost 2 vsldoi12 LHS, <0,u,1,1>
+  604816029U,  // <3,0,u,2>: Cost 1 vsldoi12 LHS, LHS
+  2691880892U, // <3,0,u,3>: Cost 3 vsldoi8 <1,2,3,0>, <u,3,0,1>
+  1557507382U, // <3,0,u,4>: Cost 2 vsldoi4 <2,3,0,u>, RHS
+  1618139290U, // <3,0,u,5>: Cost 2 vsldoi8 <1,2,3,0>, RHS
+  2691881168U, // <3,0,u,6>: Cost 3 vsldoi8 <1,2,3,0>, <u,6,3,7>
+  2661111018U, // <3,0,u,7>: Cost 3 vsldoi4 <7,3,0,u>, <7,3,0,u>
+  604816083U,  // <3,0,u,u>: Cost 1 vsldoi12 LHS, LHS
+  2619310332U, // <3,1,0,0>: Cost 3 vsldoi4 <0,3,1,0>, <0,3,1,0>
+  2756944612U, // <3,1,0,1>: Cost 3 vsldoi12 LHS, <1,0,1,2>
+  2289221724U, // <3,1,0,2>: Cost 3 vmrglw <1,2,3,0>, <0,1,1,2>
+  2619312278U, // <3,1,0,3>: Cost 3 vsldoi4 <0,3,1,0>, <3,0,1,2>
+  2619313462U, // <3,1,0,4>: Cost 3 vsldoi4 <0,3,1,0>, RHS
+  2289221970U, // <3,1,0,5>: Cost 3 vmrglw <1,2,3,0>, <0,4,1,5>
+  2232599768U, // <3,1,0,6>: Cost 3 vmrghw <3,0,1,2>, <1,6,2,7>
   3362964687U, // <3,1,0,7>: Cost 4 vmrglw <1,2,3,0>, <1,6,1,7>
-  3693057838U, // <3,1,0,u>: Cost 3 vsldoi4 <0,3,1,0>, LHS
-  3830686507U, // <3,1,1,0>: Cost 3 vsldoi12 LHS, <1,1,0,1>
-  2752299828U, // <3,1,1,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
-  3765625751U, // <3,1,1,2>: Cost 3 vsldoi8 <1,2,3,1>, <1,2,3,1>
+  2619316014U, // <3,1,0,u>: Cost 3 vsldoi4 <0,3,1,0>, LHS
+  2756944683U, // <3,1,1,0>: Cost 3 vsldoi12 LHS, <1,1,0,1>
+  1678558004U, // <3,1,1,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
+  2691883927U, // <3,1,1,2>: Cost 3 vsldoi8 <1,2,3,1>, <1,2,3,1>
   3826631496U, // <3,1,1,3>: Cost 4 vsldoi12 <0,2,1,3>, <1,1,3,3>
-  3830686547U, // <3,1,1,4>: Cost 3 vsldoi12 LHS, <1,1,4,5>
-  3830686556U, // <3,1,1,5>: Cost 3 vsldoi12 LHS, <1,1,5,5>
+  2756944723U, // <3,1,1,4>: Cost 3 vsldoi12 LHS, <1,1,4,5>
+  2756944732U, // <3,1,1,5>: Cost 3 vsldoi12 LHS, <1,1,5,5>
   3830686561U, // <3,1,1,6>: Cost 4 vsldoi12 LHS, <1,1,6,1>
   3734869228U, // <3,1,1,7>: Cost 4 vsldoi4 <7,3,1,1>, <7,3,1,1>
-  2752299828U, // <3,1,1,u>: Cost 2 vsldoi12 LHS, <1,1,1,1>
-  3770271182U, // <3,1,2,0>: Cost 3 vsldoi8 <2,0,3,1>, <2,0,3,1>
-  3830686599U, // <3,1,2,1>: Cost 3 vsldoi12 LHS, <1,2,1,3>
-  3368290454U, // <3,1,2,2>: Cost 3 vmrglw <2,1,3,2>, <3,0,1,2>
-  2752299926U, // <3,1,2,3>: Cost 2 vsldoi12 LHS, <1,2,3,0>
-  3705015606U, // <3,1,2,4>: Cost 3 vsldoi4 <2,3,1,2>, RHS
-  3830686635U, // <3,1,2,5>: Cost 3 vsldoi12 LHS, <1,2,5,3>
+  1678558004U, // <3,1,1,u>: Cost 2 vsldoi12 LHS, <1,1,1,1>
+  2696529358U, // <3,1,2,0>: Cost 3 vsldoi8 <2,0,3,1>, <2,0,3,1>
+  2756944775U, // <3,1,2,1>: Cost 3 vsldoi12 LHS, <1,2,1,3>
+  2294548630U, // <3,1,2,2>: Cost 3 vmrglw <2,1,3,2>, <3,0,1,2>
+  1678558102U, // <3,1,2,3>: Cost 2 vsldoi12 LHS, <1,2,3,0>
+  2631273782U, // <3,1,2,4>: Cost 3 vsldoi4 <2,3,1,2>, RHS
+  2756944811U, // <3,1,2,5>: Cost 3 vsldoi12 LHS, <1,2,5,3>
   3830686644U, // <3,1,2,6>: Cost 4 vsldoi12 LHS, <1,2,6,3>
-  3873817530U, // <3,1,2,7>: Cost 3 vsldoi12 LHS, <1,2,7,0>
-  2752742339U, // <3,1,2,u>: Cost 2 vsldoi12 LHS, <1,2,u,0>
-  3693076735U, // <3,1,3,0>: Cost 3 vsldoi4 <0,3,1,3>, <0,3,1,3>
-  3368960010U, // <3,1,3,1>: Cost 3 vmrglw <2,2,3,3>, <0,0,1,1>
-  3366971542U, // <3,1,3,2>: Cost 3 vmrglw <1,u,3,3>, <3,0,1,2>
-  3693078940U, // <3,1,3,3>: Cost 3 vsldoi4 <0,3,1,3>, <3,3,3,3>
-  3693079862U, // <3,1,3,4>: Cost 3 vsldoi4 <0,3,1,3>, RHS
-  3368960338U, // <3,1,3,5>: Cost 3 vmrglw <2,2,3,3>, <0,4,1,5>
+  2800075706U, // <3,1,2,7>: Cost 3 vsldoi12 LHS, <1,2,7,0>
+  1679000515U, // <3,1,2,u>: Cost 2 vsldoi12 LHS, <1,2,u,0>
+  2619334911U, // <3,1,3,0>: Cost 3 vsldoi4 <0,3,1,3>, <0,3,1,3>
+  2295218186U, // <3,1,3,1>: Cost 3 vmrglw <2,2,3,3>, <0,0,1,1>
+  2293229718U, // <3,1,3,2>: Cost 3 vmrglw <1,u,3,3>, <3,0,1,2>
+  2619337116U, // <3,1,3,3>: Cost 3 vsldoi4 <0,3,1,3>, <3,3,3,3>
+  2619338038U, // <3,1,3,4>: Cost 3 vsldoi4 <0,3,1,3>, RHS
+  2295218514U, // <3,1,3,5>: Cost 3 vmrglw <2,2,3,3>, <0,4,1,5>
   3830686729U, // <3,1,3,6>: Cost 4 vsldoi12 LHS, <1,3,6,7>
   3368961231U, // <3,1,3,7>: Cost 4 vmrglw <2,2,3,3>, <1,6,1,7>
-  3693082414U, // <3,1,3,u>: Cost 3 vsldoi4 <0,3,1,3>, LHS
-  3693084928U, // <3,1,4,0>: Cost 3 vsldoi4 <0,3,1,4>, <0,3,1,4>
-  3362996234U, // <3,1,4,1>: Cost 3 vmrglw <1,2,3,4>, <0,0,1,1>
-  3362998422U, // <3,1,4,2>: Cost 3 vmrglw <1,2,3,4>, <3,0,1,2>
-  3693087234U, // <3,1,4,3>: Cost 3 vsldoi4 <0,3,1,4>, <3,4,5,6>
-  3693088054U, // <3,1,4,4>: Cost 3 vsldoi4 <0,3,1,4>, RHS
-  3830686800U, // <3,1,4,5>: Cost 3 vsldoi12 LHS, <1,4,5,6>
+  2619340590U, // <3,1,3,u>: Cost 3 vsldoi4 <0,3,1,3>, LHS
+  2619343104U, // <3,1,4,0>: Cost 3 vsldoi4 <0,3,1,4>, <0,3,1,4>
+  2289254410U, // <3,1,4,1>: Cost 3 vmrglw <1,2,3,4>, <0,0,1,1>
+  2289256598U, // <3,1,4,2>: Cost 3 vmrglw <1,2,3,4>, <3,0,1,2>
+  2619345410U, // <3,1,4,3>: Cost 3 vsldoi4 <0,3,1,4>, <3,4,5,6>
+  2619346230U, // <3,1,4,4>: Cost 3 vsldoi4 <0,3,1,4>, RHS
+  2756944976U, // <3,1,4,5>: Cost 3 vsldoi12 LHS, <1,4,5,6>
   3362996401U, // <3,1,4,6>: Cost 4 vmrglw <1,2,3,4>, <0,2,1,6>
   3362997455U, // <3,1,4,7>: Cost 4 vmrglw <1,2,3,4>, <1,6,1,7>
-  3693090606U, // <3,1,4,u>: Cost 3 vsldoi4 <0,3,1,4>, LHS
-  3830686831U, // <3,1,5,0>: Cost 3 vsldoi12 LHS, <1,5,0,1>
+  2619348782U, // <3,1,4,u>: Cost 3 vsldoi4 <0,3,1,4>, LHS
+  2756945007U, // <3,1,5,0>: Cost 3 vsldoi12 LHS, <1,5,0,1>
   3830686840U, // <3,1,5,1>: Cost 4 vsldoi12 LHS, <1,5,1,1>
   3358361750U, // <3,1,5,2>: Cost 4 vmrglw <0,4,3,5>, <3,0,1,2>
   3830686857U, // <3,1,5,3>: Cost 4 vsldoi12 LHS, <1,5,3,0>
-  3830686871U, // <3,1,5,4>: Cost 3 vsldoi12 LHS, <1,5,4,5>
-  3368313170U, // <3,1,5,5>: Cost 3 vmrglw <2,1,3,5>, <0,4,1,5>
+  2756945047U, // <3,1,5,4>: Cost 3 vsldoi12 LHS, <1,5,4,5>
+  2294571346U, // <3,1,5,5>: Cost 3 vmrglw <2,1,3,5>, <0,4,1,5>
   3806105698U, // <3,1,5,6>: Cost 4 vsldoi8 <u,0,3,1>, <5,6,7,0>
   3873817774U, // <3,1,5,7>: Cost 4 vsldoi12 LHS, <1,5,7,1>
-  3830686903U, // <3,1,5,u>: Cost 3 vsldoi12 LHS, <1,5,u,1>
+  2756945079U, // <3,1,5,u>: Cost 3 vsldoi12 LHS, <1,5,u,1>
   3830686912U, // <3,1,6,0>: Cost 4 vsldoi12 LHS, <1,6,0,1>
-  3830686927U, // <3,1,6,1>: Cost 3 vsldoi12 LHS, <1,6,1,7>
-  3310289814U, // <3,1,6,2>: Cost 3 vmrghw <3,6,0,7>, <1,2,3,0>
+  2756945103U, // <3,1,6,1>: Cost 3 vsldoi12 LHS, <1,6,1,7>
+  2236547990U, // <3,1,6,2>: Cost 3 vmrghw <3,6,0,7>, <1,2,3,0>
   3826631905U, // <3,1,6,3>: Cost 4 vsldoi12 <0,2,1,3>, <1,6,3,7>
   3830686952U, // <3,1,6,4>: Cost 4 vsldoi12 LHS, <1,6,4,5>
-  3830686963U, // <3,1,6,5>: Cost 3 vsldoi12 LHS, <1,6,5,7>
+  2756945139U, // <3,1,6,5>: Cost 3 vsldoi12 LHS, <1,6,5,7>
   3830686972U, // <3,1,6,6>: Cost 4 vsldoi12 LHS, <1,6,6,7>
-  3873817854U, // <3,1,6,7>: Cost 3 vsldoi12 LHS, <1,6,7,0>
-  3830686990U, // <3,1,6,u>: Cost 3 vsldoi12 LHS, <1,6,u,7>
+  2800076030U, // <3,1,6,7>: Cost 3 vsldoi12 LHS, <1,6,7,0>
+  2756945166U, // <3,1,6,u>: Cost 3 vsldoi12 LHS, <1,6,u,7>
   3699081318U, // <3,1,7,0>: Cost 4 vsldoi4 <1,3,1,7>, LHS
-  3371646986U, // <3,1,7,1>: Cost 3 vmrglw <2,6,3,7>, <0,0,1,1>
-  3371649174U, // <3,1,7,2>: Cost 3 vmrglw <2,6,3,7>, <3,0,1,2>
+  2297905162U, // <3,1,7,1>: Cost 3 vmrglw <2,6,3,7>, <0,0,1,1>
+  2297907350U, // <3,1,7,2>: Cost 3 vmrglw <2,6,3,7>, <3,0,1,2>
   3365675182U, // <3,1,7,3>: Cost 4 vmrglw <1,6,3,7>, <0,2,1,3>
   3699084598U, // <3,1,7,4>: Cost 4 vsldoi4 <1,3,1,7>, RHS
-  3371647314U, // <3,1,7,5>: Cost 3 vmrglw <2,6,3,7>, <0,4,1,5>
-  3371647153U, // <3,1,7,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,1,6>
+  2297905490U, // <3,1,7,5>: Cost 3 vmrglw <2,6,3,7>, <0,4,1,5>
+  2297905329U, // <3,1,7,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,1,6>
   3368330447U, // <3,1,7,7>: Cost 4 vmrglw <2,1,3,7>, <1,6,1,7>
-  3371646993U, // <3,1,7,u>: Cost 3 vmrglw <2,6,3,7>, <0,0,1,u>
-  3693117700U, // <3,1,u,0>: Cost 3 vsldoi4 <0,3,1,u>, <0,3,1,u>
-  2752299828U, // <3,1,u,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
-  3363031190U, // <3,1,u,2>: Cost 3 vmrglw <1,2,3,u>, <3,0,1,2>
-  2752742780U, // <3,1,u,3>: Cost 2 vsldoi12 LHS, <1,u,3,0>
-  3693120822U, // <3,1,u,4>: Cost 3 vsldoi4 <0,3,1,u>, RHS
-  3830687121U, // <3,1,u,5>: Cost 3 vsldoi12 LHS, <1,u,5,3>
-  3371647153U, // <3,1,u,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,1,6>
-  3873818016U, // <3,1,u,7>: Cost 3 vsldoi12 LHS, <1,u,7,0>
-  2756945321U, // <3,1,u,u>: Cost 2 vsldoi12 LHS, <1,u,u,0>
+  2297905169U, // <3,1,7,u>: Cost 3 vmrglw <2,6,3,7>, <0,0,1,u>
+  2619375876U, // <3,1,u,0>: Cost 3 vsldoi4 <0,3,1,u>, <0,3,1,u>
+  1678558004U, // <3,1,u,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
+  2289289366U, // <3,1,u,2>: Cost 3 vmrglw <1,2,3,u>, <3,0,1,2>
+  1679000956U, // <3,1,u,3>: Cost 2 vsldoi12 LHS, <1,u,3,0>
+  2619378998U, // <3,1,u,4>: Cost 3 vsldoi4 <0,3,1,u>, RHS
+  2756945297U, // <3,1,u,5>: Cost 3 vsldoi12 LHS, <1,u,5,3>
+  2297905329U, // <3,1,u,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,1,6>
+  2800076192U, // <3,1,u,7>: Cost 3 vsldoi12 LHS, <1,u,7,0>
+  1683203497U, // <3,1,u,u>: Cost 2 vsldoi12 LHS, <1,u,u,0>
   3362964203U, // <3,2,0,0>: Cost 4 vmrglw <1,2,3,0>, <1,0,2,0>
-  3362964204U, // <3,2,0,1>: Cost 3 vmrglw <1,2,3,0>, <1,0,2,1>
-  3362964286U, // <3,2,0,2>: Cost 3 vmrglw <1,2,3,0>, <1,1,2,2>
-  2289221734U, // <3,2,0,3>: Cost 2 vmrglw <1,2,3,0>, LHS
+  2289222380U, // <3,2,0,1>: Cost 3 vmrglw <1,2,3,0>, <1,0,2,1>
+  2289222462U, // <3,2,0,2>: Cost 3 vmrglw <1,2,3,0>, <1,1,2,2>
+  1215479910U, // <3,2,0,3>: Cost 2 vmrglw <1,2,3,0>, LHS
   3362964207U, // <3,2,0,4>: Cost 4 vmrglw <1,2,3,0>, <1,0,2,4>
-  3362964532U, // <3,2,0,5>: Cost 3 vmrglw <1,2,3,0>, <1,4,2,5>
-  3306342330U, // <3,2,0,6>: Cost 3 vmrghw <3,0,1,2>, <2,6,3,7>
+  2289222708U, // <3,2,0,5>: Cost 3 vmrglw <1,2,3,0>, <1,4,2,5>
+  2232600506U, // <3,2,0,6>: Cost 3 vmrghw <3,0,1,2>, <2,6,3,7>
   3396142296U, // <3,2,0,7>: Cost 4 vmrglw <6,7,3,0>, <1,6,2,7>
-  2289221739U, // <3,2,0,u>: Cost 2 vmrglw <1,2,3,0>, LHS
+  1215479915U, // <3,2,0,u>: Cost 2 vmrglw <1,2,3,0>, LHS
   3699105894U, // <3,2,1,0>: Cost 4 vsldoi4 <1,3,2,1>, LHS
   3765633844U, // <3,2,1,1>: Cost 4 vsldoi8 <1,2,3,2>, <1,1,1,1>
-  3765633944U, // <3,2,1,2>: Cost 3 vsldoi8 <1,2,3,2>, <1,2,3,2>
-  3826042399U, // <3,2,1,3>: Cost 3 vsldoi12 LHS, <2,1,3,1>
+  2691892120U, // <3,2,1,2>: Cost 3 vsldoi8 <1,2,3,2>, <1,2,3,2>
+  2752300575U, // <3,2,1,3>: Cost 3 vsldoi12 LHS, <2,1,3,1>
   3699109174U, // <3,2,1,4>: Cost 4 vsldoi4 <1,3,2,1>, RHS
   3830687280U, // <3,2,1,5>: Cost 5 vsldoi12 LHS, <2,1,5,0>
   3830687289U, // <3,2,1,6>: Cost 4 vsldoi12 LHS, <2,1,6,0>
   3874260548U, // <3,2,1,7>: Cost 4 vsldoi12 LHS, <2,1,7,2>
-  3826484812U, // <3,2,1,u>: Cost 3 vsldoi12 LHS, <2,1,u,1>
-  3705086054U, // <3,2,2,0>: Cost 3 vsldoi4 <2,3,2,2>, LHS
-  3770943008U, // <3,2,2,1>: Cost 3 vsldoi8 <2,1,3,2>, <2,1,3,2>
-  2752300648U, // <3,2,2,2>: Cost 2 vsldoi12 LHS, <2,2,2,2>
-  2752300658U, // <3,2,2,3>: Cost 2 vsldoi12 LHS, <2,2,3,3>
-  3705089334U, // <3,2,2,4>: Cost 3 vsldoi4 <2,3,2,2>, RHS
+  2752742988U, // <3,2,1,u>: Cost 3 vsldoi12 LHS, <2,1,u,1>
+  2631344230U, // <3,2,2,0>: Cost 3 vsldoi4 <2,3,2,2>, LHS
+  2697201184U, // <3,2,2,1>: Cost 3 vsldoi8 <2,1,3,2>, <2,1,3,2>
+  1678558824U, // <3,2,2,2>: Cost 2 vsldoi12 LHS, <2,2,2,2>
+  1678558834U, // <3,2,2,3>: Cost 2 vsldoi12 LHS, <2,2,3,3>
+  2631347510U, // <3,2,2,4>: Cost 3 vsldoi4 <2,3,2,2>, RHS
   3368953613U, // <3,2,2,5>: Cost 4 vmrglw <2,2,3,2>, <2,4,2,5>
-  3308046266U, // <3,2,2,6>: Cost 3 vmrghw <3,2,6,3>, <2,6,3,7>
+  2234304442U, // <3,2,2,6>: Cost 3 vmrghw <3,2,6,3>, <2,6,3,7>
   3368953777U, // <3,2,2,7>: Cost 4 vmrglw <2,2,3,2>, <2,6,2,7>
-  2752743071U, // <3,2,2,u>: Cost 2 vsldoi12 LHS, <2,2,u,3>
-  2752300710U, // <3,2,3,0>: Cost 2 vsldoi12 LHS, <2,3,0,1>
-  3826042543U, // <3,2,3,1>: Cost 3 vsldoi12 LHS, <2,3,1,1>
-  3826042553U, // <3,2,3,2>: Cost 3 vsldoi12 LHS, <2,3,2,2>
-  2295218278U, // <3,2,3,3>: Cost 2 vmrglw <2,2,3,3>, LHS
-  2752300750U, // <3,2,3,4>: Cost 2 vsldoi12 LHS, <2,3,4,5>
-  3873818327U, // <3,2,3,5>: Cost 3 vsldoi12 LHS, <2,3,5,5>
-  3308488634U, // <3,2,3,6>: Cost 3 vmrghw <3,3,3,3>, <2,6,3,7>
-  3873818340U, // <3,2,3,7>: Cost 3 vsldoi12 LHS, <2,3,7,0>
-  2752300782U, // <3,2,3,u>: Cost 2 vsldoi12 LHS, <2,3,u,1>
+  1679001247U, // <3,2,2,u>: Cost 2 vsldoi12 LHS, <2,2,u,3>
+  1678558886U, // <3,2,3,0>: Cost 2 vsldoi12 LHS, <2,3,0,1>
+  2752300719U, // <3,2,3,1>: Cost 3 vsldoi12 LHS, <2,3,1,1>
+  2752300729U, // <3,2,3,2>: Cost 3 vsldoi12 LHS, <2,3,2,2>
+  1221476454U, // <3,2,3,3>: Cost 2 vmrglw <2,2,3,3>, LHS
+  1678558926U, // <3,2,3,4>: Cost 2 vsldoi12 LHS, <2,3,4,5>
+  2800076503U, // <3,2,3,5>: Cost 3 vsldoi12 LHS, <2,3,5,5>
+  2234746810U, // <3,2,3,6>: Cost 3 vmrghw <3,3,3,3>, <2,6,3,7>
+  2800076516U, // <3,2,3,7>: Cost 3 vsldoi12 LHS, <2,3,7,0>
+  1678558958U, // <3,2,3,u>: Cost 2 vsldoi12 LHS, <2,3,u,1>
   3699130470U, // <3,2,4,0>: Cost 4 vsldoi4 <1,3,2,4>, LHS
   3362996972U, // <3,2,4,1>: Cost 4 vmrglw <1,2,3,4>, <1,0,2,1>
-  3362997864U, // <3,2,4,2>: Cost 3 vmrglw <1,2,3,4>, <2,2,2,2>
-  2289254502U, // <3,2,4,3>: Cost 2 vmrglw <1,2,3,4>, LHS
+  2289256040U, // <3,2,4,2>: Cost 3 vmrglw <1,2,3,4>, <2,2,2,2>
+  1215512678U, // <3,2,4,3>: Cost 2 vmrglw <1,2,3,4>, LHS
   3362998676U, // <3,2,4,4>: Cost 4 vmrglw <1,2,3,4>, <3,3,2,4>
-  3765636406U, // <3,2,4,5>: Cost 3 vsldoi8 <1,2,3,2>, RHS
-  3309324218U, // <3,2,4,6>: Cost 3 vmrghw <3,4,5,6>, <2,6,3,7>
+  2691894582U, // <3,2,4,5>: Cost 3 vsldoi8 <1,2,3,2>, RHS
+  2235582394U, // <3,2,4,6>: Cost 3 vmrghw <3,4,5,6>, <2,6,3,7>
   3734967544U, // <3,2,4,7>: Cost 4 vsldoi4 <7,3,2,4>, <7,3,2,4>
-  2289254507U, // <3,2,4,u>: Cost 2 vmrglw <1,2,3,4>, LHS
+  1215512683U, // <3,2,4,u>: Cost 2 vmrglw <1,2,3,4>, LHS
   3705110630U, // <3,2,5,0>: Cost 4 vsldoi4 <2,3,2,5>, LHS
   3368313985U, // <3,2,5,1>: Cost 4 vmrglw <2,1,3,5>, <1,5,2,1>
   3368314472U, // <3,2,5,2>: Cost 4 vmrglw <2,1,3,5>, <2,2,2,2>
-  3830687592U, // <3,2,5,3>: Cost 3 vsldoi12 LHS, <2,5,3,6>
+  2756945768U, // <3,2,5,3>: Cost 3 vsldoi12 LHS, <2,5,3,6>
   3705113910U, // <3,2,5,4>: Cost 4 vsldoi4 <2,3,2,5>, RHS
   3310061416U, // <3,2,5,5>: Cost 4 vmrghw <3,5,6,6>, <2,5,3,6>
   3310135226U, // <3,2,5,6>: Cost 4 vmrghw <3,5,7,6>, <2,6,3,7>
   3370305457U, // <3,2,5,7>: Cost 5 vmrglw <2,4,3,5>, <2,6,2,7>
-  3826485141U, // <3,2,5,u>: Cost 3 vsldoi12 LHS, <2,5,u,6>
-  3705118822U, // <3,2,6,0>: Cost 3 vsldoi4 <2,3,2,6>, LHS
+  2752743317U, // <3,2,5,u>: Cost 3 vsldoi12 LHS, <2,5,u,6>
+  2631376998U, // <3,2,6,0>: Cost 3 vsldoi4 <2,3,2,6>, LHS
   3705119540U, // <3,2,6,1>: Cost 4 vsldoi4 <2,3,2,6>, <1,1,1,1>
-  3705120445U, // <3,2,6,2>: Cost 3 vsldoi4 <2,3,2,6>, <2,3,2,6>
-  2752300986U, // <3,2,6,3>: Cost 2 vsldoi12 LHS, <2,6,3,7>
-  3705122102U, // <3,2,6,4>: Cost 3 vsldoi4 <2,3,2,6>, RHS
+  2631378621U, // <3,2,6,2>: Cost 3 vsldoi4 <2,3,2,6>, <2,3,2,6>
+  1678559162U, // <3,2,6,3>: Cost 2 vsldoi12 LHS, <2,6,3,7>
+  2631380278U, // <3,2,6,4>: Cost 3 vsldoi4 <2,3,2,6>, RHS
   3370976956U, // <3,2,6,5>: Cost 4 vmrglw <2,5,3,6>, <2,3,2,5>
-  3310806970U, // <3,2,6,6>: Cost 3 vmrghw <3,6,7,7>, <2,6,3,7>
+  2237065146U, // <3,2,6,6>: Cost 3 vmrghw <3,6,7,7>, <2,6,3,7>
   3798815594U, // <3,2,6,7>: Cost 4 vsldoi8 <6,7,3,2>, <6,7,3,2>
-  2752743399U, // <3,2,6,u>: Cost 2 vsldoi12 LHS, <2,6,u,7>
-  3873818602U, // <3,2,7,0>: Cost 3 vsldoi12 LHS, <2,7,0,1>
+  1679001575U, // <3,2,6,u>: Cost 2 vsldoi12 LHS, <2,6,u,7>
+  2800076778U, // <3,2,7,0>: Cost 3 vsldoi12 LHS, <2,7,0,1>
   3371647724U, // <3,2,7,1>: Cost 4 vmrglw <2,6,3,7>, <1,0,2,1>
-  3371648616U, // <3,2,7,2>: Cost 3 vmrglw <2,6,3,7>, <2,2,2,2>
-  2297905254U, // <3,2,7,3>: Cost 2 vmrglw <2,6,3,7>, LHS
+  2297906792U, // <3,2,7,2>: Cost 3 vmrglw <2,6,3,7>, <2,2,2,2>
+  1224163430U, // <3,2,7,3>: Cost 2 vmrglw <2,6,3,7>, LHS
   3705130294U, // <3,2,7,4>: Cost 4 vsldoi4 <2,3,2,7>, RHS
   3371648052U, // <3,2,7,5>: Cost 4 vmrglw <2,6,3,7>, <1,4,2,5>
-  3371648701U, // <3,2,7,6>: Cost 3 vmrglw <2,6,3,7>, <2,3,2,6>
+  2297906877U, // <3,2,7,6>: Cost 3 vmrglw <2,6,3,7>, <2,3,2,6>
   3371648702U, // <3,2,7,7>: Cost 4 vmrglw <2,6,3,7>, <2,3,2,7>
-  2297905259U, // <3,2,7,u>: Cost 2 vmrglw <2,6,3,7>, LHS
-  2752743483U, // <3,2,u,0>: Cost 2 vsldoi12 LHS, <2,u,0,1>
-  3826485316U, // <3,2,u,1>: Cost 3 vsldoi12 LHS, <2,u,1,1>
-  2752300648U, // <3,2,u,2>: Cost 2 vsldoi12 LHS, <2,2,2,2>
-  2752301144U, // <3,2,u,3>: Cost 2 vsldoi12 LHS, <2,u,3,3>
-  2752743523U, // <3,2,u,4>: Cost 2 vsldoi12 LHS, <2,u,4,5>
-  3765639322U, // <3,2,u,5>: Cost 3 vsldoi8 <1,2,3,2>, RHS
-  3311650746U, // <3,2,u,6>: Cost 3 vmrghw <3,u,1,2>, <2,6,3,7>
-  3874261113U, // <3,2,u,7>: Cost 3 vsldoi12 LHS, <2,u,7,0>
-  2752743555U, // <3,2,u,u>: Cost 2 vsldoi12 LHS, <2,u,u,1>
-  2289222550U, // <3,3,0,0>: Cost 2 vmrglw <1,2,3,0>, <1,2,3,0>
-  2752301206U, // <3,3,0,1>: Cost 2 vsldoi12 LHS, <3,0,1,2>
-  3705145024U, // <3,3,0,2>: Cost 3 vsldoi4 <2,3,3,0>, <2,3,3,0>
-  3362965106U, // <3,3,0,3>: Cost 3 vmrglw <1,2,3,0>, <2,2,3,3>
-  3826043056U, // <3,3,0,4>: Cost 3 vsldoi12 LHS, <3,0,4,1>
+  1224163435U, // <3,2,7,u>: Cost 2 vmrglw <2,6,3,7>, LHS
+  1679001659U, // <3,2,u,0>: Cost 2 vsldoi12 LHS, <2,u,0,1>
+  2752743492U, // <3,2,u,1>: Cost 3 vsldoi12 LHS, <2,u,1,1>
+  1678558824U, // <3,2,u,2>: Cost 2 vsldoi12 LHS, <2,2,2,2>
+  1678559320U, // <3,2,u,3>: Cost 2 vsldoi12 LHS, <2,u,3,3>
+  1679001699U, // <3,2,u,4>: Cost 2 vsldoi12 LHS, <2,u,4,5>
+  2691897498U, // <3,2,u,5>: Cost 3 vsldoi8 <1,2,3,2>, RHS
+  2237908922U, // <3,2,u,6>: Cost 3 vmrghw <3,u,1,2>, <2,6,3,7>
+  2800519289U, // <3,2,u,7>: Cost 3 vsldoi12 LHS, <2,u,7,0>
+  1679001731U, // <3,2,u,u>: Cost 2 vsldoi12 LHS, <2,u,u,1>
+  1215480726U, // <3,3,0,0>: Cost 2 vmrglw <1,2,3,0>, <1,2,3,0>
+  1678559382U, // <3,3,0,1>: Cost 2 vsldoi12 LHS, <3,0,1,2>
+  2631403200U, // <3,3,0,2>: Cost 3 vsldoi4 <2,3,3,0>, <2,3,3,0>
+  2289223282U, // <3,3,0,3>: Cost 3 vmrglw <1,2,3,0>, <2,2,3,3>
+  2752301232U, // <3,3,0,4>: Cost 3 vsldoi12 LHS, <3,0,4,1>
   3362965027U, // <3,3,0,5>: Cost 4 vmrglw <1,2,3,0>, <2,1,3,5>
   3362965352U, // <3,3,0,6>: Cost 4 vmrglw <1,2,3,0>, <2,5,3,6>
-  3362965434U, // <3,3,0,7>: Cost 3 vmrglw <1,2,3,0>, <2,6,3,7>
-  2752301269U, // <3,3,0,u>: Cost 2 vsldoi12 LHS, <3,0,u,2>
+  2289223610U, // <3,3,0,7>: Cost 3 vmrglw <1,2,3,0>, <2,6,3,7>
+  1678559445U, // <3,3,0,u>: Cost 2 vsldoi12 LHS, <3,0,u,2>
   3830687964U, // <3,3,1,0>: Cost 4 vsldoi12 LHS, <3,1,0,0>
-  3826043110U, // <3,3,1,1>: Cost 3 vsldoi12 LHS, <3,1,1,1>
-  3826043121U, // <3,3,1,2>: Cost 3 vsldoi12 LHS, <3,1,2,3>
-  3378899356U, // <3,3,1,3>: Cost 3 vmrglw <3,u,3,1>, <3,3,3,3>
+  2752301286U, // <3,3,1,1>: Cost 3 vsldoi12 LHS, <3,1,1,1>
+  2752301297U, // <3,3,1,2>: Cost 3 vsldoi12 LHS, <3,1,2,3>
+  2305157532U, // <3,3,1,3>: Cost 3 vmrglw <3,u,3,1>, <3,3,3,3>
   3830688000U, // <3,3,1,4>: Cost 4 vsldoi12 LHS, <3,1,4,0>
   3830688009U, // <3,3,1,5>: Cost 4 vsldoi12 LHS, <3,1,5,0>
   3830688019U, // <3,3,1,6>: Cost 4 vsldoi12 LHS, <3,1,6,1>
   3362973626U, // <3,3,1,7>: Cost 4 vmrglw <1,2,3,1>, <2,6,3,7>
-  3826485543U, // <3,3,1,u>: Cost 3 vsldoi12 LHS, <3,1,u,3>
-  3705159782U, // <3,3,2,0>: Cost 3 vsldoi4 <2,3,3,2>, LHS
+  2752743719U, // <3,3,1,u>: Cost 3 vsldoi12 LHS, <3,1,u,3>
+  2631417958U, // <3,3,2,0>: Cost 3 vsldoi4 <2,3,3,2>, LHS
   3826043193U, // <3,3,2,1>: Cost 4 vsldoi12 LHS, <3,2,1,3>
-  2697873010U, // <3,3,2,2>: Cost 2 vsldoi8 <2,2,3,3>, <2,2,3,3>
-  3826043208U, // <3,3,2,3>: Cost 3 vsldoi12 LHS, <3,2,3,0>
-  3705163062U, // <3,3,2,4>: Cost 3 vsldoi4 <2,3,3,2>, RHS
+  1624131186U, // <3,3,2,2>: Cost 2 vsldoi8 <2,2,3,3>, <2,2,3,3>
+  2752301384U, // <3,3,2,3>: Cost 3 vsldoi12 LHS, <3,2,3,0>
+  2631421238U, // <3,3,2,4>: Cost 3 vsldoi4 <2,3,3,2>, RHS
   3826485602U, // <3,3,2,5>: Cost 4 vsldoi12 LHS, <3,2,5,u>
-  3826043238U, // <3,3,2,6>: Cost 3 vsldoi12 LHS, <3,2,6,3>
-  3844991343U, // <3,3,2,7>: Cost 3 vsldoi12 <3,2,7,3>, <3,2,7,3>
-  2701854808U, // <3,3,2,u>: Cost 2 vsldoi8 <2,u,3,3>, <2,u,3,3>
-  2637398118U, // <3,3,3,0>: Cost 2 vsldoi4 <3,3,3,3>, LHS
-  3375597735U, // <3,3,3,1>: Cost 3 vmrglw <3,3,3,3>, <3,0,3,1>
-  3771615554U, // <3,3,3,2>: Cost 3 vsldoi8 <2,2,3,3>, <3,2,2,3>
-  1477230694U, // <3,3,3,3>: Cost 1 vspltisw3 LHS
-  2637401398U, // <3,3,3,4>: Cost 2 vsldoi4 <3,3,3,3>, RHS
-  3375598063U, // <3,3,3,5>: Cost 3 vmrglw <3,3,3,3>, <3,4,3,5>
-  3771615891U, // <3,3,3,6>: Cost 3 vsldoi8 <2,2,3,3>, <3,6,3,7>
-  3368961978U, // <3,3,3,7>: Cost 3 vmrglw <2,2,3,3>, <2,6,3,7>
-  1477230694U, // <3,3,3,u>: Cost 1 vspltisw3 LHS
-  3362997142U, // <3,3,4,0>: Cost 3 vmrglw <1,2,3,4>, <1,2,3,0>
-  3705176986U, // <3,3,4,1>: Cost 3 vsldoi4 <2,3,3,4>, <1,2,3,4>
-  3705177796U, // <3,3,4,2>: Cost 3 vsldoi4 <2,3,3,4>, <2,3,3,4>
-  3362997874U, // <3,3,4,3>: Cost 3 vmrglw <1,2,3,4>, <2,2,3,3>
-  2289255322U, // <3,3,4,4>: Cost 2 vmrglw <1,2,3,4>, <1,2,3,4>
-  2752743938U, // <3,3,4,5>: Cost 2 vsldoi12 LHS, <3,4,5,6>
+  2752301414U, // <3,3,2,6>: Cost 3 vsldoi12 LHS, <3,2,6,3>
+  2771249519U, // <3,3,2,7>: Cost 3 vsldoi12 <3,2,7,3>, <3,2,7,3>
+  1628112984U, // <3,3,2,u>: Cost 2 vsldoi8 <2,u,3,3>, <2,u,3,3>
+  1563656294U, // <3,3,3,0>: Cost 2 vsldoi4 <3,3,3,3>, LHS
+  2301855911U, // <3,3,3,1>: Cost 3 vmrglw <3,3,3,3>, <3,0,3,1>
+  2697873730U, // <3,3,3,2>: Cost 3 vsldoi8 <2,2,3,3>, <3,2,2,3>
+  403488870U,  // <3,3,3,3>: Cost 1 vspltisw3 LHS
+  1563659574U, // <3,3,3,4>: Cost 2 vsldoi4 <3,3,3,3>, RHS
+  2301856239U, // <3,3,3,5>: Cost 3 vmrglw <3,3,3,3>, <3,4,3,5>
+  2697874067U, // <3,3,3,6>: Cost 3 vsldoi8 <2,2,3,3>, <3,6,3,7>
+  2295220154U, // <3,3,3,7>: Cost 3 vmrglw <2,2,3,3>, <2,6,3,7>
+  403488870U,  // <3,3,3,u>: Cost 1 vspltisw3 LHS
+  2289255318U, // <3,3,4,0>: Cost 3 vmrglw <1,2,3,4>, <1,2,3,0>
+  2631435162U, // <3,3,4,1>: Cost 3 vsldoi4 <2,3,3,4>, <1,2,3,4>
+  2631435972U, // <3,3,4,2>: Cost 3 vsldoi4 <2,3,3,4>, <2,3,3,4>
+  2289256050U, // <3,3,4,3>: Cost 3 vmrglw <1,2,3,4>, <2,2,3,3>
+  1215513498U, // <3,3,4,4>: Cost 2 vmrglw <1,2,3,4>, <1,2,3,4>
+  1679002114U, // <3,3,4,5>: Cost 2 vsldoi12 LHS, <3,4,5,6>
   3362998120U, // <3,3,4,6>: Cost 4 vmrglw <1,2,3,4>, <2,5,3,6>
-  3362998202U, // <3,3,4,7>: Cost 3 vmrglw <1,2,3,4>, <2,6,3,7>
-  2752743965U, // <3,3,4,u>: Cost 2 vsldoi12 LHS, <3,4,u,6>
+  2289256378U, // <3,3,4,7>: Cost 3 vmrglw <1,2,3,4>, <2,6,3,7>
+  1679002141U, // <3,3,4,u>: Cost 2 vsldoi12 LHS, <3,4,u,6>
   3831130657U, // <3,3,5,0>: Cost 4 vsldoi12 LHS, <3,5,0,1>
   3376277671U, // <3,3,5,1>: Cost 4 vmrglw <3,4,3,5>, <3,0,3,1>
   3771617012U, // <3,3,5,2>: Cost 4 vsldoi8 <2,2,3,3>, <5,2,2,3>
-  3376277916U, // <3,3,5,3>: Cost 3 vmrglw <3,4,3,5>, <3,3,3,3>
+  2302536092U, // <3,3,5,3>: Cost 3 vmrglw <3,4,3,5>, <3,3,3,3>
   3831130697U, // <3,3,5,4>: Cost 4 vsldoi12 LHS, <3,5,4,5>
-  3368314403U, // <3,3,5,5>: Cost 3 vmrglw <2,1,3,5>, <2,1,3,5>
-  3874261597U, // <3,3,5,6>: Cost 3 vsldoi12 LHS, <3,5,6,7>
+  2294572579U, // <3,3,5,5>: Cost 3 vmrglw <2,1,3,5>, <2,1,3,5>
+  2800519773U, // <3,3,5,6>: Cost 3 vsldoi12 LHS, <3,5,6,7>
   3368314810U, // <3,3,5,7>: Cost 4 vmrglw <2,1,3,5>, <2,6,3,7>
-  3874261615U, // <3,3,5,u>: Cost 3 vsldoi12 LHS, <3,5,u,7>
-  3873819256U, // <3,3,6,0>: Cost 3 vsldoi12 LHS, <3,6,0,7>
+  2800519791U, // <3,3,5,u>: Cost 3 vsldoi12 LHS, <3,5,u,7>
+  2800077432U, // <3,3,6,0>: Cost 3 vsldoi12 LHS, <3,6,0,7>
   3310291185U, // <3,3,6,1>: Cost 4 vmrghw <3,6,0,7>, <3,1,2,3>
-  3862907530U, // <3,3,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <3,6,2,7>
-  3838724755U, // <3,3,6,3>: Cost 3 vsldoi12 <2,2,3,3>, <3,6,3,7>
-  3873819292U, // <3,3,6,4>: Cost 3 vsldoi12 LHS, <3,6,4,7>
+  2789165706U, // <3,3,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <3,6,2,7>
+  2764982931U, // <3,3,6,3>: Cost 3 vsldoi12 <2,2,3,3>, <3,6,3,7>
+  2800077468U, // <3,3,6,4>: Cost 3 vsldoi12 LHS, <3,6,4,7>
   3873819301U, // <3,3,6,5>: Cost 4 vsldoi12 LHS, <3,6,5,7>
-  3370977128U, // <3,3,6,6>: Cost 3 vmrglw <2,5,3,6>, <2,5,3,6>
-  3798823787U, // <3,3,6,7>: Cost 3 vsldoi8 <6,7,3,3>, <6,7,3,3>
-  3799487420U, // <3,3,6,u>: Cost 3 vsldoi8 <6,u,3,3>, <6,u,3,3>
-  3705200742U, // <3,3,7,0>: Cost 3 vsldoi4 <2,3,3,7>, LHS
+  2297235304U, // <3,3,6,6>: Cost 3 vmrglw <2,5,3,6>, <2,5,3,6>
+  2725081963U, // <3,3,6,7>: Cost 3 vsldoi8 <6,7,3,3>, <6,7,3,3>
+  2725745596U, // <3,3,6,u>: Cost 3 vsldoi8 <6,u,3,3>, <6,u,3,3>
+  2631458918U, // <3,3,7,0>: Cost 3 vsldoi4 <2,3,3,7>, LHS
   3705201460U, // <3,3,7,1>: Cost 4 vsldoi4 <2,3,3,7>, <1,1,1,1>
-  3705202375U, // <3,3,7,2>: Cost 3 vsldoi4 <2,3,3,7>, <2,3,3,7>
-  3371648626U, // <3,3,7,3>: Cost 3 vmrglw <2,6,3,7>, <2,2,3,3>
-  3705204022U, // <3,3,7,4>: Cost 3 vsldoi4 <2,3,3,7>, RHS
+  2631460551U, // <3,3,7,2>: Cost 3 vsldoi4 <2,3,3,7>, <2,3,3,7>
+  2297906802U, // <3,3,7,3>: Cost 3 vmrglw <2,6,3,7>, <2,2,3,3>
+  2631462198U, // <3,3,7,4>: Cost 3 vsldoi4 <2,3,3,7>, RHS
   3371648547U, // <3,3,7,5>: Cost 4 vmrglw <2,6,3,7>, <2,1,3,5>
   3371648548U, // <3,3,7,6>: Cost 4 vmrglw <2,6,3,7>, <2,1,3,6>
-  2297907130U, // <3,3,7,7>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
-  2297907130U, // <3,3,7,u>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
-  2289222550U, // <3,3,u,0>: Cost 2 vmrglw <1,2,3,0>, <1,2,3,0>
-  2752744222U, // <3,3,u,1>: Cost 2 vsldoi12 LHS, <3,u,1,2>
-  2733709192U, // <3,3,u,2>: Cost 2 vsldoi8 <u,2,3,3>, <u,2,3,3>
-  1477230694U, // <3,3,u,3>: Cost 1 vspltisw3 LHS
-  2637401398U, // <3,3,u,4>: Cost 2 vsldoi4 <3,3,3,3>, RHS
-  2752744262U, // <3,3,u,5>: Cost 2 vsldoi12 LHS, <3,u,5,6>
-  3830688588U, // <3,3,u,6>: Cost 3 vsldoi12 LHS, <3,u,6,3>
-  2297907130U, // <3,3,u,7>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
-  1477230694U, // <3,3,u,u>: Cost 1 vspltisw3 LHS
-  3765649408U, // <3,4,0,0>: Cost 3 vsldoi8 <1,2,3,4>, <0,0,0,0>
-  2691907686U, // <3,4,0,1>: Cost 2 vsldoi8 <1,2,3,4>, LHS
-  3705218761U, // <3,4,0,2>: Cost 3 vsldoi4 <2,3,4,0>, <2,3,4,0>
-  3306343556U, // <3,4,0,3>: Cost 3 vmrghw <3,0,1,2>, <4,3,5,0>
-  3765649746U, // <3,4,0,4>: Cost 3 vsldoi8 <1,2,3,4>, <0,4,1,5>
-  2232601910U, // <3,4,0,5>: Cost 2 vmrghw <3,0,1,2>, RHS
+  1224165306U, // <3,3,7,7>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
+  1224165306U, // <3,3,7,u>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
+  1215480726U, // <3,3,u,0>: Cost 2 vmrglw <1,2,3,0>, <1,2,3,0>
+  1679002398U, // <3,3,u,1>: Cost 2 vsldoi12 LHS, <3,u,1,2>
+  1659967368U, // <3,3,u,2>: Cost 2 vsldoi8 <u,2,3,3>, <u,2,3,3>
+  403488870U,  // <3,3,u,3>: Cost 1 vspltisw3 LHS
+  1563659574U, // <3,3,u,4>: Cost 2 vsldoi4 <3,3,3,3>, RHS
+  1679002438U, // <3,3,u,5>: Cost 2 vsldoi12 LHS, <3,u,5,6>
+  2756946764U, // <3,3,u,6>: Cost 3 vsldoi12 LHS, <3,u,6,3>
+  1224165306U, // <3,3,u,7>: Cost 2 vmrglw <2,6,3,7>, <2,6,3,7>
+  403488870U,  // <3,3,u,u>: Cost 1 vspltisw3 LHS
+  2691907584U, // <3,4,0,0>: Cost 3 vsldoi8 <1,2,3,4>, <0,0,0,0>
+  1618165862U, // <3,4,0,1>: Cost 2 vsldoi8 <1,2,3,4>, LHS
+  2631476937U, // <3,4,0,2>: Cost 3 vsldoi4 <2,3,4,0>, <2,3,4,0>
+  2232601732U, // <3,4,0,3>: Cost 3 vmrghw <3,0,1,2>, <4,3,5,0>
+  2691907922U, // <3,4,0,4>: Cost 3 vsldoi8 <1,2,3,4>, <0,4,1,5>
+  1158860086U, // <3,4,0,5>: Cost 2 vmrghw <3,0,1,2>, RHS
   3306343806U, // <3,4,0,6>: Cost 4 vmrghw <3,0,1,2>, <4,6,5,7>
   3366947484U, // <3,4,0,7>: Cost 4 vmrglw <1,u,3,0>, <3,6,4,7>
-  2691908253U, // <3,4,0,u>: Cost 2 vsldoi8 <1,2,3,4>, LHS
-  3705225318U, // <3,4,1,0>: Cost 3 vsldoi4 <2,3,4,1>, LHS
-  3765650228U, // <3,4,1,1>: Cost 3 vsldoi8 <1,2,3,4>, <1,1,1,1>
-  2691908506U, // <3,4,1,2>: Cost 2 vsldoi8 <1,2,3,4>, <1,2,3,4>
+  1618166429U, // <3,4,0,u>: Cost 2 vsldoi8 <1,2,3,4>, LHS
+  2631483494U, // <3,4,1,0>: Cost 3 vsldoi4 <2,3,4,1>, LHS
+  2691908404U, // <3,4,1,1>: Cost 3 vsldoi8 <1,2,3,4>, <1,1,1,1>
+  1618166682U, // <3,4,1,2>: Cost 2 vsldoi8 <1,2,3,4>, <1,2,3,4>
   3765650393U, // <3,4,1,3>: Cost 4 vsldoi8 <1,2,3,4>, <1,3,1,4>
-  3705228598U, // <3,4,1,4>: Cost 3 vsldoi4 <2,3,4,1>, RHS
-  3830688738U, // <3,4,1,5>: Cost 3 vsldoi12 LHS, <4,1,5,0>
+  2631486774U, // <3,4,1,4>: Cost 3 vsldoi4 <2,3,4,1>, RHS
+  2756946914U, // <3,4,1,5>: Cost 3 vsldoi12 LHS, <4,1,5,0>
   3765650639U, // <3,4,1,6>: Cost 4 vsldoi8 <1,2,3,4>, <1,6,1,7>
   3735090439U, // <3,4,1,7>: Cost 4 vsldoi4 <7,3,4,1>, <7,3,4,1>
-  2695890304U, // <3,4,1,u>: Cost 2 vsldoi8 <1,u,3,4>, <1,u,3,4>
+  1622148480U, // <3,4,1,u>: Cost 2 vsldoi8 <1,u,3,4>, <1,u,3,4>
   3765650893U, // <3,4,2,0>: Cost 4 vsldoi8 <1,2,3,4>, <2,0,3,0>
   3831131154U, // <3,4,2,1>: Cost 4 vsldoi12 LHS, <4,2,1,3>
-  3765651048U, // <3,4,2,2>: Cost 3 vsldoi8 <1,2,3,4>, <2,2,2,2>
-  3765651110U, // <3,4,2,3>: Cost 3 vsldoi8 <1,2,3,4>, <2,3,0,1>
-  3772950293U, // <3,4,2,4>: Cost 3 vsldoi8 <2,4,3,4>, <2,4,3,4>
-  3307605302U, // <3,4,2,5>: Cost 3 vmrghw <3,2,0,3>, RHS
-  3765651386U, // <3,4,2,6>: Cost 3 vsldoi8 <1,2,3,4>, <2,6,3,7>
-  3774941192U, // <3,4,2,7>: Cost 3 vsldoi8 <2,7,3,4>, <2,7,3,4>
-  3765651515U, // <3,4,2,u>: Cost 3 vsldoi8 <1,2,3,4>, <2,u,0,1>
-  3765651606U, // <3,4,3,0>: Cost 3 vsldoi8 <1,2,3,4>, <3,0,1,2>
+  2691909224U, // <3,4,2,2>: Cost 3 vsldoi8 <1,2,3,4>, <2,2,2,2>
+  2691909286U, // <3,4,2,3>: Cost 3 vsldoi8 <1,2,3,4>, <2,3,0,1>
+  2699208469U, // <3,4,2,4>: Cost 3 vsldoi8 <2,4,3,4>, <2,4,3,4>
+  2233863478U, // <3,4,2,5>: Cost 3 vmrghw <3,2,0,3>, RHS
+  2691909562U, // <3,4,2,6>: Cost 3 vsldoi8 <1,2,3,4>, <2,6,3,7>
+  2701199368U, // <3,4,2,7>: Cost 3 vsldoi8 <2,7,3,4>, <2,7,3,4>
+  2691909691U, // <3,4,2,u>: Cost 3 vsldoi8 <1,2,3,4>, <2,u,0,1>
+  2691909782U, // <3,4,3,0>: Cost 3 vsldoi8 <1,2,3,4>, <3,0,1,2>
   3765651686U, // <3,4,3,1>: Cost 4 vsldoi8 <1,2,3,4>, <3,1,1,1>
-  3765651796U, // <3,4,3,2>: Cost 3 vsldoi8 <1,2,3,4>, <3,2,4,3>
-  3765651868U, // <3,4,3,3>: Cost 3 vsldoi8 <1,2,3,4>, <3,3,3,3>
-  3765651920U, // <3,4,3,4>: Cost 3 vsldoi8 <1,2,3,4>, <3,4,0,1>
-  2234748214U, // <3,4,3,5>: Cost 2 vmrghw <3,3,3,3>, RHS
-  3765652124U, // <3,4,3,6>: Cost 3 vsldoi8 <1,2,3,4>, <3,6,4,7>
+  2691909972U, // <3,4,3,2>: Cost 3 vsldoi8 <1,2,3,4>, <3,2,4,3>
+  2691910044U, // <3,4,3,3>: Cost 3 vsldoi8 <1,2,3,4>, <3,3,3,3>
+  2691910096U, // <3,4,3,4>: Cost 3 vsldoi8 <1,2,3,4>, <3,4,0,1>
+  1161006390U, // <3,4,3,5>: Cost 2 vmrghw <3,3,3,3>, RHS
+  2691910300U, // <3,4,3,6>: Cost 3 vsldoi8 <1,2,3,4>, <3,6,4,7>
   3368962716U, // <3,4,3,7>: Cost 4 vmrglw <2,2,3,3>, <3,6,4,7>
-  2234748457U, // <3,4,3,u>: Cost 2 vmrghw <3,3,3,3>, RHS
-  3705249894U, // <3,4,4,0>: Cost 3 vsldoi4 <2,3,4,4>, LHS
-  3705250714U, // <3,4,4,1>: Cost 3 vsldoi4 <2,3,4,4>, <1,2,3,4>
-  3705251533U, // <3,4,4,2>: Cost 3 vsldoi4 <2,3,4,4>, <2,3,4,4>
-  3362998612U, // <3,4,4,3>: Cost 3 vmrglw <1,2,3,4>, <3,2,4,3>
-  2800078032U, // <3,4,4,4>: Cost 2 vsldoi12 LHS, <4,4,4,4>
-  2691910966U, // <3,4,4,5>: Cost 2 vsldoi8 <1,2,3,4>, RHS
+  1161006633U, // <3,4,3,u>: Cost 2 vmrghw <3,3,3,3>, RHS
+  2631508070U, // <3,4,4,0>: Cost 3 vsldoi4 <2,3,4,4>, LHS
+  2631508890U, // <3,4,4,1>: Cost 3 vsldoi4 <2,3,4,4>, <1,2,3,4>
+  2631509709U, // <3,4,4,2>: Cost 3 vsldoi4 <2,3,4,4>, <2,3,4,4>
+  2289256788U, // <3,4,4,3>: Cost 3 vmrglw <1,2,3,4>, <3,2,4,3>
+  1726336208U, // <3,4,4,4>: Cost 2 vsldoi12 LHS, <4,4,4,4>
+  1618169142U, // <3,4,4,5>: Cost 2 vsldoi8 <1,2,3,4>, RHS
   3362998858U, // <3,4,4,6>: Cost 4 vmrglw <1,2,3,4>, <3,5,4,6>
-  3362998940U, // <3,4,4,7>: Cost 3 vmrglw <1,2,3,4>, <3,6,4,7>
-  2691911209U, // <3,4,4,u>: Cost 2 vsldoi8 <1,2,3,4>, RHS
-  2631516262U, // <3,4,5,0>: Cost 2 vsldoi4 <2,3,4,5>, LHS
-  3705258804U, // <3,4,5,1>: Cost 3 vsldoi4 <2,3,4,5>, <1,1,1,1>
-  2631517902U, // <3,4,5,2>: Cost 2 vsldoi4 <2,3,4,5>, <2,3,4,5>
-  3705260182U, // <3,4,5,3>: Cost 3 vsldoi4 <2,3,4,5>, <3,0,1,2>
-  2631519542U, // <3,4,5,4>: Cost 2 vsldoi4 <2,3,4,5>, RHS
-  3370305230U, // <3,4,5,5>: Cost 3 vmrglw <2,4,3,5>, <2,3,4,5>
-  1678560566U, // <3,4,5,6>: Cost 1 vsldoi12 LHS, RHS
-  3735123211U, // <3,4,5,7>: Cost 3 vsldoi4 <7,3,4,5>, <7,3,4,5>
-  1678560584U, // <3,4,5,u>: Cost 1 vsldoi12 LHS, RHS
+  2289257116U, // <3,4,4,7>: Cost 3 vmrglw <1,2,3,4>, <3,6,4,7>
+  1618169385U, // <3,4,4,u>: Cost 2 vsldoi8 <1,2,3,4>, RHS
+  1557774438U, // <3,4,5,0>: Cost 2 vsldoi4 <2,3,4,5>, LHS
+  2631516980U, // <3,4,5,1>: Cost 3 vsldoi4 <2,3,4,5>, <1,1,1,1>
+  1557776078U, // <3,4,5,2>: Cost 2 vsldoi4 <2,3,4,5>, <2,3,4,5>
+  2631518358U, // <3,4,5,3>: Cost 3 vsldoi4 <2,3,4,5>, <3,0,1,2>
+  1557777718U, // <3,4,5,4>: Cost 2 vsldoi4 <2,3,4,5>, RHS
+  2296563406U, // <3,4,5,5>: Cost 3 vmrglw <2,4,3,5>, <2,3,4,5>
+  604818742U,  // <3,4,5,6>: Cost 1 vsldoi12 LHS, RHS
+  2661381387U, // <3,4,5,7>: Cost 3 vsldoi4 <7,3,4,5>, <7,3,4,5>
+  604818760U,  // <3,4,5,u>: Cost 1 vsldoi12 LHS, RHS
   3705266278U, // <3,4,6,0>: Cost 4 vsldoi4 <2,3,4,6>, LHS
   3831131482U, // <3,4,6,1>: Cost 4 vsldoi12 LHS, <4,6,1,7>
-  3807457786U, // <3,4,6,2>: Cost 3 vsldoi8 <u,2,3,4>, <6,2,7,3>
+  2733715962U, // <3,4,6,2>: Cost 3 vsldoi8 <u,2,3,4>, <6,2,7,3>
   3844771180U, // <3,4,6,3>: Cost 4 vsldoi12 <3,2,4,3>, <4,6,3,7>
-  3873820021U, // <3,4,6,4>: Cost 3 vsldoi12 LHS, <4,6,4,7>
-  3310292278U, // <3,4,6,5>: Cost 3 vmrghw <3,6,0,7>, RHS
-  3807458104U, // <3,4,6,6>: Cost 3 vsldoi8 <u,2,3,4>, <6,6,6,6>
-  3798831980U, // <3,4,6,7>: Cost 3 vsldoi8 <6,7,3,4>, <6,7,3,4>
-  3310292521U, // <3,4,6,u>: Cost 3 vmrghw <3,6,0,7>, RHS
-  3807458298U, // <3,4,7,0>: Cost 3 vsldoi8 <u,2,3,4>, <7,0,1,2>
+  2800078197U, // <3,4,6,4>: Cost 3 vsldoi12 LHS, <4,6,4,7>
+  2236550454U, // <3,4,6,5>: Cost 3 vmrghw <3,6,0,7>, RHS
+  2733716280U, // <3,4,6,6>: Cost 3 vsldoi8 <u,2,3,4>, <6,6,6,6>
+  2725090156U, // <3,4,6,7>: Cost 3 vsldoi8 <6,7,3,4>, <6,7,3,4>
+  2236550697U, // <3,4,6,u>: Cost 3 vmrghw <3,6,0,7>, RHS
+  2733716474U, // <3,4,7,0>: Cost 3 vsldoi8 <u,2,3,4>, <7,0,1,2>
   3371647013U, // <3,4,7,1>: Cost 4 vmrglw <2,6,3,7>, <0,0,4,1>
-  3801486512U, // <3,4,7,2>: Cost 3 vsldoi8 <7,2,3,4>, <7,2,3,4>
+  2727744688U, // <3,4,7,2>: Cost 3 vsldoi8 <7,2,3,4>, <7,2,3,4>
   3371649364U, // <3,4,7,3>: Cost 4 vmrglw <2,6,3,7>, <3,2,4,3>
-  3807458662U, // <3,4,7,4>: Cost 3 vsldoi8 <u,2,3,4>, <7,4,5,6>
-  3371648718U, // <3,4,7,5>: Cost 3 vmrglw <2,6,3,7>, <2,3,4,5>
+  2733716838U, // <3,4,7,4>: Cost 3 vsldoi8 <u,2,3,4>, <7,4,5,6>
+  2297906894U, // <3,4,7,5>: Cost 3 vmrglw <2,6,3,7>, <2,3,4,5>
   3371647180U, // <3,4,7,6>: Cost 4 vmrglw <2,6,3,7>, <0,2,4,6>
-  3807458924U, // <3,4,7,7>: Cost 3 vsldoi8 <u,2,3,4>, <7,7,7,7>
-  3371648721U, // <3,4,7,u>: Cost 3 vmrglw <2,6,3,7>, <2,3,4,u>
-  2631540838U, // <3,4,u,0>: Cost 2 vsldoi4 <2,3,4,u>, LHS
-  2691913518U, // <3,4,u,1>: Cost 2 vsldoi8 <1,2,3,4>, LHS
-  2631542481U, // <3,4,u,2>: Cost 2 vsldoi4 <2,3,4,u>, <2,3,4,u>
-  3765655484U, // <3,4,u,3>: Cost 3 vsldoi8 <1,2,3,4>, <u,3,0,1>
-  2631544118U, // <3,4,u,4>: Cost 2 vsldoi4 <2,3,4,u>, RHS
-  2691913882U, // <3,4,u,5>: Cost 2 vsldoi8 <1,2,3,4>, RHS
-  1678560809U, // <3,4,u,6>: Cost 1 vsldoi12 LHS, RHS
-  3735147790U, // <3,4,u,7>: Cost 3 vsldoi4 <7,3,4,u>, <7,3,4,u>
-  1678560827U, // <3,4,u,u>: Cost 1 vsldoi12 LHS, RHS
-  3717234790U, // <3,5,0,0>: Cost 3 vsldoi4 <4,3,5,0>, LHS
-  3830689352U, // <3,5,0,1>: Cost 3 vsldoi12 LHS, <5,0,1,2>
-  3404770843U, // <3,5,0,2>: Cost 3 vmrglw <u,2,3,0>, <4,u,5,2>
-  3717236886U, // <3,5,0,3>: Cost 3 vsldoi4 <4,3,5,0>, <3,0,1,2>
-  3830689378U, // <3,5,0,4>: Cost 3 vsldoi12 LHS, <5,0,4,1>
-  3873820267U, // <3,5,0,5>: Cost 3 vsldoi12 LHS, <5,0,5,1>
-  3362966018U, // <3,5,0,6>: Cost 3 vmrglw <1,2,3,0>, <3,4,5,6>
+  2733717100U, // <3,4,7,7>: Cost 3 vsldoi8 <u,2,3,4>, <7,7,7,7>
+  2297906897U, // <3,4,7,u>: Cost 3 vmrglw <2,6,3,7>, <2,3,4,u>
+  1557799014U, // <3,4,u,0>: Cost 2 vsldoi4 <2,3,4,u>, LHS
+  1618171694U, // <3,4,u,1>: Cost 2 vsldoi8 <1,2,3,4>, LHS
+  1557800657U, // <3,4,u,2>: Cost 2 vsldoi4 <2,3,4,u>, <2,3,4,u>
+  2691913660U, // <3,4,u,3>: Cost 3 vsldoi8 <1,2,3,4>, <u,3,0,1>
+  1557802294U, // <3,4,u,4>: Cost 2 vsldoi4 <2,3,4,u>, RHS
+  1618172058U, // <3,4,u,5>: Cost 2 vsldoi8 <1,2,3,4>, RHS
+  604818985U,  // <3,4,u,6>: Cost 1 vsldoi12 LHS, RHS
+  2661405966U, // <3,4,u,7>: Cost 3 vsldoi4 <7,3,4,u>, <7,3,4,u>
+  604819003U,  // <3,4,u,u>: Cost 1 vsldoi12 LHS, RHS
+  2643492966U, // <3,5,0,0>: Cost 3 vsldoi4 <4,3,5,0>, LHS
+  2756947528U, // <3,5,0,1>: Cost 3 vsldoi12 LHS, <5,0,1,2>
+  2331029019U, // <3,5,0,2>: Cost 3 vmrglw <u,2,3,0>, <4,u,5,2>
+  2643495062U, // <3,5,0,3>: Cost 3 vsldoi4 <4,3,5,0>, <3,0,1,2>
+  2756947554U, // <3,5,0,4>: Cost 3 vsldoi12 LHS, <5,0,4,1>
+  2800078443U, // <3,5,0,5>: Cost 3 vsldoi12 LHS, <5,0,5,1>
+  2289224194U, // <3,5,0,6>: Cost 3 vmrglw <1,2,3,0>, <3,4,5,6>
   3362964723U, // <3,5,0,7>: Cost 4 vmrglw <1,2,3,0>, <1,6,5,7>
-  3830689414U, // <3,5,0,u>: Cost 3 vsldoi12 LHS, <5,0,u,1>
-  3873820303U, // <3,5,1,0>: Cost 3 vsldoi12 LHS, <5,1,0,1>
-  3406769042U, // <3,5,1,1>: Cost 3 vmrglw <u,5,3,1>, <4,0,5,1>
-  3765658523U, // <3,5,1,2>: Cost 3 vsldoi8 <1,2,3,5>, <1,2,3,5>
+  2756947590U, // <3,5,0,u>: Cost 3 vsldoi12 LHS, <5,0,u,1>
+  2800078479U, // <3,5,1,0>: Cost 3 vsldoi12 LHS, <5,1,0,1>
+  2333027218U, // <3,5,1,1>: Cost 3 vmrglw <u,5,3,1>, <4,0,5,1>
+  2691916699U, // <3,5,1,2>: Cost 3 vsldoi8 <1,2,3,5>, <1,2,3,5>
   3832901294U, // <3,5,1,3>: Cost 4 vsldoi12 <1,2,5,3>, <5,1,3,5>
-  3873820343U, // <3,5,1,4>: Cost 3 vsldoi12 LHS, <5,1,4,5>
+  2800078519U, // <3,5,1,4>: Cost 3 vsldoi12 LHS, <5,1,4,5>
   3830689467U, // <3,5,1,5>: Cost 4 vsldoi12 LHS, <5,1,5,0>
   3830689481U, // <3,5,1,6>: Cost 4 vsldoi12 LHS, <5,1,6,5>
   3873820365U, // <3,5,1,7>: Cost 4 vsldoi12 LHS, <5,1,7,0>
-  3873820375U, // <3,5,1,u>: Cost 3 vsldoi12 LHS, <5,1,u,1>
+  2800078551U, // <3,5,1,u>: Cost 3 vsldoi12 LHS, <5,1,u,1>
   3770967487U, // <3,5,2,0>: Cost 4 vsldoi8 <2,1,3,5>, <2,0,1,4>
-  3770967587U, // <3,5,2,1>: Cost 3 vsldoi8 <2,1,3,5>, <2,1,3,5>
+  2697225763U, // <3,5,2,1>: Cost 3 vsldoi8 <2,1,3,5>, <2,1,3,5>
   3830689523U, // <3,5,2,2>: Cost 4 vsldoi12 LHS, <5,2,2,2>
-  3772958414U, // <3,5,2,3>: Cost 3 vsldoi8 <2,4,3,5>, <2,3,4,5>
-  3772958486U, // <3,5,2,4>: Cost 3 vsldoi8 <2,4,3,5>, <2,4,3,5>
-  3856789263U, // <3,5,2,5>: Cost 3 vsldoi12 <5,2,5,3>, <5,2,5,3>
-  3856863000U, // <3,5,2,6>: Cost 3 vsldoi12 <5,2,6,3>, <5,2,6,3>
+  2699216590U, // <3,5,2,3>: Cost 3 vsldoi8 <2,4,3,5>, <2,3,4,5>
+  2699216662U, // <3,5,2,4>: Cost 3 vsldoi8 <2,4,3,5>, <2,4,3,5>
+  2783047439U, // <3,5,2,5>: Cost 3 vsldoi12 <5,2,5,3>, <5,2,5,3>
+  2783121176U, // <3,5,2,6>: Cost 3 vsldoi12 <5,2,6,3>, <5,2,6,3>
   3856936737U, // <3,5,2,7>: Cost 4 vsldoi12 <5,2,7,3>, <5,2,7,3>
-  3775613018U, // <3,5,2,u>: Cost 3 vsldoi8 <2,u,3,5>, <2,u,3,5>
-  3717259366U, // <3,5,3,0>: Cost 3 vsldoi4 <4,3,5,3>, LHS
-  3404794770U, // <3,5,3,1>: Cost 3 vmrglw <u,2,3,3>, <4,0,5,1>
+  2701871194U, // <3,5,2,u>: Cost 3 vsldoi8 <2,u,3,5>, <2,u,3,5>
+  2643517542U, // <3,5,3,0>: Cost 3 vsldoi4 <4,3,5,3>, LHS
+  2331052946U, // <3,5,3,1>: Cost 3 vmrglw <u,2,3,3>, <4,0,5,1>
   3699345010U, // <3,5,3,2>: Cost 4 vsldoi4 <1,3,5,3>, <2,2,3,3>
-  3778931100U, // <3,5,3,3>: Cost 3 vsldoi8 <3,4,3,5>, <3,3,3,3>
-  3778931183U, // <3,5,3,4>: Cost 3 vsldoi8 <3,4,3,5>, <3,4,3,5>
-  3404795098U, // <3,5,3,5>: Cost 3 vmrglw <u,2,3,3>, <4,4,5,5>
-  3368962562U, // <3,5,3,6>: Cost 3 vmrglw <2,2,3,3>, <3,4,5,6>
+  2705189276U, // <3,5,3,3>: Cost 3 vsldoi8 <3,4,3,5>, <3,3,3,3>
+  2705189359U, // <3,5,3,4>: Cost 3 vsldoi8 <3,4,3,5>, <3,4,3,5>
+  2331053274U, // <3,5,3,5>: Cost 3 vmrglw <u,2,3,3>, <4,4,5,5>
+  2295220738U, // <3,5,3,6>: Cost 3 vmrglw <2,2,3,3>, <3,4,5,6>
   3368961267U, // <3,5,3,7>: Cost 4 vmrglw <2,2,3,3>, <1,6,5,7>
-  3368962564U, // <3,5,3,u>: Cost 3 vmrglw <2,2,3,3>, <3,4,5,u>
-  3717267558U, // <3,5,4,0>: Cost 3 vsldoi4 <4,3,5,4>, LHS
-  3404802962U, // <3,5,4,1>: Cost 3 vmrglw <u,2,3,4>, <4,0,5,1>
-  3309326104U, // <3,5,4,2>: Cost 3 vmrghw <3,4,5,6>, <5,2,6,3>
-  3717270018U, // <3,5,4,3>: Cost 3 vsldoi4 <4,3,5,4>, <3,4,5,6>
-  3809455322U, // <3,5,4,4>: Cost 3 vsldoi8 <u,5,3,5>, <4,4,5,5>
-  3830689716U, // <3,5,4,5>: Cost 3 vsldoi12 LHS, <5,4,5,6>
-  3362998786U, // <3,5,4,6>: Cost 3 vmrglw <1,2,3,4>, <3,4,5,6>
+  2295220740U, // <3,5,3,u>: Cost 3 vmrglw <2,2,3,3>, <3,4,5,u>
+  2643525734U, // <3,5,4,0>: Cost 3 vsldoi4 <4,3,5,4>, LHS
+  2331061138U, // <3,5,4,1>: Cost 3 vmrglw <u,2,3,4>, <4,0,5,1>
+  2235584280U, // <3,5,4,2>: Cost 3 vmrghw <3,4,5,6>, <5,2,6,3>
+  2643528194U, // <3,5,4,3>: Cost 3 vsldoi4 <4,3,5,4>, <3,4,5,6>
+  2735713498U, // <3,5,4,4>: Cost 3 vsldoi8 <u,5,3,5>, <4,4,5,5>
+  2756947892U, // <3,5,4,5>: Cost 3 vsldoi12 LHS, <5,4,5,6>
+  2289256962U, // <3,5,4,6>: Cost 3 vmrglw <1,2,3,4>, <3,4,5,6>
   3362997491U, // <3,5,4,7>: Cost 4 vmrglw <1,2,3,4>, <1,6,5,7>
-  3830689743U, // <3,5,4,u>: Cost 3 vsldoi12 LHS, <5,4,u,6>
-  3873820627U, // <3,5,5,0>: Cost 3 vsldoi12 LHS, <5,5,0,1>
-  3873820636U, // <3,5,5,1>: Cost 3 vsldoi12 LHS, <5,5,1,1>
-  3705333463U, // <3,5,5,2>: Cost 3 vsldoi4 <2,3,5,5>, <2,3,5,5>
+  2756947919U, // <3,5,4,u>: Cost 3 vsldoi12 LHS, <5,4,u,6>
+  2800078803U, // <3,5,5,0>: Cost 3 vsldoi12 LHS, <5,5,0,1>
+  2800078812U, // <3,5,5,1>: Cost 3 vsldoi12 LHS, <5,5,1,1>
+  2631591639U, // <3,5,5,2>: Cost 3 vsldoi4 <2,3,5,5>, <2,3,5,5>
   3832901616U, // <3,5,5,3>: Cost 4 vsldoi12 <1,2,5,3>, <5,5,3,3>
-  3873820667U, // <3,5,5,4>: Cost 3 vsldoi12 LHS, <5,5,4,5>
-  2800078852U, // <3,5,5,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
-  3873820686U, // <3,5,5,6>: Cost 3 vsldoi12 LHS, <5,5,6,6>
+  2800078843U, // <3,5,5,4>: Cost 3 vsldoi12 LHS, <5,5,4,5>
+  1726337028U, // <3,5,5,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
+  2800078862U, // <3,5,5,6>: Cost 3 vsldoi12 LHS, <5,5,6,6>
   3368314099U, // <3,5,5,7>: Cost 4 vmrglw <2,1,3,5>, <1,6,5,7>
-  2800078852U, // <3,5,5,u>: Cost 2 vsldoi12 LHS, <5,5,5,5>
-  3873820708U, // <3,5,6,0>: Cost 3 vsldoi12 LHS, <5,6,0,1>
-  3873820723U, // <3,5,6,1>: Cost 3 vsldoi12 LHS, <5,6,1,7>
-  3705341656U, // <3,5,6,2>: Cost 3 vsldoi4 <2,3,5,6>, <2,3,5,6>
-  3873820738U, // <3,5,6,3>: Cost 3 vsldoi12 LHS, <5,6,3,4>
-  3873820748U, // <3,5,6,4>: Cost 3 vsldoi12 LHS, <5,6,4,5>
-  3873820759U, // <3,5,6,5>: Cost 3 vsldoi12 LHS, <5,6,5,7>
-  3370977794U, // <3,5,6,6>: Cost 3 vmrglw <2,5,3,6>, <3,4,5,6>
-  2800078946U, // <3,5,6,7>: Cost 2 vsldoi12 LHS, <5,6,7,0>
-  2800078955U, // <3,5,6,u>: Cost 2 vsldoi12 LHS, <5,6,u,0>
+  1726337028U, // <3,5,5,u>: Cost 2 vsldoi12 LHS, <5,5,5,5>
+  2800078884U, // <3,5,6,0>: Cost 3 vsldoi12 LHS, <5,6,0,1>
+  2800078899U, // <3,5,6,1>: Cost 3 vsldoi12 LHS, <5,6,1,7>
+  2631599832U, // <3,5,6,2>: Cost 3 vsldoi4 <2,3,5,6>, <2,3,5,6>
+  2800078914U, // <3,5,6,3>: Cost 3 vsldoi12 LHS, <5,6,3,4>
+  2800078924U, // <3,5,6,4>: Cost 3 vsldoi12 LHS, <5,6,4,5>
+  2800078935U, // <3,5,6,5>: Cost 3 vsldoi12 LHS, <5,6,5,7>
+  2297235970U, // <3,5,6,6>: Cost 3 vmrglw <2,5,3,6>, <3,4,5,6>
+  1726337122U, // <3,5,6,7>: Cost 2 vsldoi12 LHS, <5,6,7,0>
+  1726337131U, // <3,5,6,u>: Cost 2 vsldoi12 LHS, <5,6,u,0>
   3699376230U, // <3,5,7,0>: Cost 4 vsldoi4 <1,3,5,7>, LHS
-  3407481746U, // <3,5,7,1>: Cost 3 vmrglw <u,6,3,7>, <4,0,5,1>
+  2333739922U, // <3,5,7,1>: Cost 3 vmrglw <u,6,3,7>, <4,0,5,1>
   3699378106U, // <3,5,7,2>: Cost 4 vsldoi4 <1,3,5,7>, <2,6,3,7>
   3371647915U, // <3,5,7,3>: Cost 4 vmrglw <2,6,3,7>, <1,2,5,3>
   3699379510U, // <3,5,7,4>: Cost 4 vsldoi4 <1,3,5,7>, RHS
-  3407482074U, // <3,5,7,5>: Cost 3 vmrglw <u,6,3,7>, <4,4,5,5>
-  3371649538U, // <3,5,7,6>: Cost 3 vmrglw <2,6,3,7>, <3,4,5,6>
+  2333740250U, // <3,5,7,5>: Cost 3 vmrglw <u,6,3,7>, <4,4,5,5>
+  2297907714U, // <3,5,7,6>: Cost 3 vmrglw <2,6,3,7>, <3,4,5,6>
   3370984691U, // <3,5,7,7>: Cost 4 vmrglw <2,5,3,7>, <1,6,5,7>
-  3371649540U, // <3,5,7,u>: Cost 3 vmrglw <2,6,3,7>, <3,4,5,u>
-  3873820870U, // <3,5,u,0>: Cost 3 vsldoi12 LHS, <5,u,0,1>
-  3830690000U, // <3,5,u,1>: Cost 3 vsldoi12 LHS, <5,u,1,2>
-  3404770843U, // <3,5,u,2>: Cost 3 vmrglw <u,2,3,0>, <4,u,5,2>
-  3873820900U, // <3,5,u,3>: Cost 3 vsldoi12 LHS, <5,u,3,4>
-  3873820909U, // <3,5,u,4>: Cost 3 vsldoi12 LHS, <5,u,4,4>
-  2800078852U, // <3,5,u,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
-  3363031554U, // <3,5,u,6>: Cost 3 vmrglw <1,2,3,u>, <3,4,5,6>
-  2800079108U, // <3,5,u,7>: Cost 2 vsldoi12 LHS, <5,u,7,0>
-  2800079117U, // <3,5,u,u>: Cost 2 vsldoi12 LHS, <5,u,u,0>
+  2297907716U, // <3,5,7,u>: Cost 3 vmrglw <2,6,3,7>, <3,4,5,u>
+  2800079046U, // <3,5,u,0>: Cost 3 vsldoi12 LHS, <5,u,0,1>
+  2756948176U, // <3,5,u,1>: Cost 3 vsldoi12 LHS, <5,u,1,2>
+  2331029019U, // <3,5,u,2>: Cost 3 vmrglw <u,2,3,0>, <4,u,5,2>
+  2800079076U, // <3,5,u,3>: Cost 3 vsldoi12 LHS, <5,u,3,4>
+  2800079085U, // <3,5,u,4>: Cost 3 vsldoi12 LHS, <5,u,4,4>
+  1726337028U, // <3,5,u,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
+  2289289730U, // <3,5,u,6>: Cost 3 vmrglw <1,2,3,u>, <3,4,5,6>
+  1726337284U, // <3,5,u,7>: Cost 2 vsldoi12 LHS, <5,u,7,0>
+  1726337293U, // <3,5,u,u>: Cost 2 vsldoi12 LHS, <5,u,u,0>
   3773628416U, // <3,6,0,0>: Cost 4 vsldoi8 <2,5,3,6>, <0,0,0,0>
-  3773628518U, // <3,6,0,1>: Cost 3 vsldoi8 <2,5,3,6>, LHS
-  3862909225U, // <3,6,0,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,0,2,1>
+  2699886694U, // <3,6,0,1>: Cost 3 vsldoi8 <2,5,3,6>, LHS
+  2789167401U, // <3,6,0,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,0,2,1>
   3362965862U, // <3,6,0,3>: Cost 4 vmrglw <1,2,3,0>, <3,2,6,3>
   3773628754U, // <3,6,0,4>: Cost 4 vsldoi8 <2,5,3,6>, <0,4,1,5>
   3723284326U, // <3,6,0,5>: Cost 4 vsldoi4 <5,3,6,0>, <5,3,6,0>
-  3873821005U, // <3,6,0,6>: Cost 3 vsldoi12 LHS, <6,0,6,1>
-  2289225014U, // <3,6,0,7>: Cost 2 vmrglw <1,2,3,0>, RHS
-  2289225015U, // <3,6,0,u>: Cost 2 vmrglw <1,2,3,0>, RHS
+  2800079181U, // <3,6,0,6>: Cost 3 vsldoi12 LHS, <6,0,6,1>
+  1215483190U, // <3,6,0,7>: Cost 2 vmrglw <1,2,3,0>, RHS
+  1215483191U, // <3,6,0,u>: Cost 2 vmrglw <1,2,3,0>, RHS
   3873821032U, // <3,6,1,0>: Cost 4 vsldoi12 LHS, <6,1,0,1>
   3773629236U, // <3,6,1,1>: Cost 4 vsldoi8 <2,5,3,6>, <1,1,1,1>
-  3765666716U, // <3,6,1,2>: Cost 3 vsldoi8 <1,2,3,6>, <1,2,3,6>
+  2691924892U, // <3,6,1,2>: Cost 3 vsldoi8 <1,2,3,6>, <1,2,3,6>
   3830690184U, // <3,6,1,3>: Cost 5 vsldoi12 LHS, <6,1,3,6>
   3873821072U, // <3,6,1,4>: Cost 4 vsldoi12 LHS, <6,1,4,5>
   3873821082U, // <3,6,1,5>: Cost 4 vsldoi12 LHS, <6,1,5,6>
   3403453240U, // <3,6,1,6>: Cost 4 vmrglw <u,0,3,1>, <6,6,6,6>
-  3362975030U, // <3,6,1,7>: Cost 3 vmrglw <1,2,3,1>, RHS
-  3362975031U, // <3,6,1,u>: Cost 3 vmrglw <1,2,3,1>, RHS
-  3735240806U, // <3,6,2,0>: Cost 3 vsldoi4 <7,3,6,2>, LHS
+  2289233206U, // <3,6,1,7>: Cost 3 vmrglw <1,2,3,1>, RHS
+  2289233207U, // <3,6,1,u>: Cost 3 vmrglw <1,2,3,1>, RHS
+  2661498982U, // <3,6,2,0>: Cost 3 vsldoi4 <7,3,6,2>, LHS
   3770975780U, // <3,6,2,1>: Cost 4 vsldoi8 <2,1,3,6>, <2,1,3,6>
-  3705382621U, // <3,6,2,2>: Cost 3 vsldoi4 <2,3,6,2>, <2,3,6,2>
+  2631640797U, // <3,6,2,2>: Cost 3 vsldoi4 <2,3,6,2>, <2,3,6,2>
   3771639485U, // <3,6,2,3>: Cost 4 vsldoi8 <2,2,3,6>, <2,3,2,6>
-  3735244086U, // <3,6,2,4>: Cost 3 vsldoi4 <7,3,6,2>, RHS
-  3773630312U, // <3,6,2,5>: Cost 3 vsldoi8 <2,5,3,6>, <2,5,3,6>
-  3735245306U, // <3,6,2,6>: Cost 3 vsldoi4 <7,3,6,2>, <6,2,7,3>
-  2789167610U, // <3,6,2,7>: Cost 2 vsldoi12 <6,2,7,3>, <6,2,7,3>
-  2789241347U, // <3,6,2,u>: Cost 2 vsldoi12 <6,2,u,3>, <6,2,u,3>
+  2661502262U, // <3,6,2,4>: Cost 3 vsldoi4 <7,3,6,2>, RHS
+  2699888488U, // <3,6,2,5>: Cost 3 vsldoi8 <2,5,3,6>, <2,5,3,6>
+  2661503482U, // <3,6,2,6>: Cost 3 vsldoi4 <7,3,6,2>, <6,2,7,3>
+  1715425786U, // <3,6,2,7>: Cost 2 vsldoi12 <6,2,7,3>, <6,2,7,3>
+  1715499523U, // <3,6,2,u>: Cost 2 vsldoi12 <6,2,u,3>, <6,2,u,3>
   3773630614U, // <3,6,3,0>: Cost 4 vsldoi8 <2,5,3,6>, <3,0,1,2>
   3372942825U, // <3,6,3,1>: Cost 4 vmrglw <2,u,3,3>, <2,0,6,1>
-  3308491258U, // <3,6,3,2>: Cost 3 vmrghw <3,3,3,3>, <6,2,7,3>
+  2234749434U, // <3,6,3,2>: Cost 3 vmrghw <3,3,3,3>, <6,2,7,3>
   3368962406U, // <3,6,3,3>: Cost 4 vmrglw <2,2,3,3>, <3,2,6,3>
-  3773630978U, // <3,6,3,4>: Cost 3 vsldoi8 <2,5,3,6>, <3,4,5,6>
+  2699889154U, // <3,6,3,4>: Cost 3 vsldoi8 <2,5,3,6>, <3,4,5,6>
   3773631068U, // <3,6,3,5>: Cost 4 vsldoi8 <2,5,3,6>, <3,5,6,6>
-  3404796728U, // <3,6,3,6>: Cost 3 vmrglw <u,2,3,3>, <6,6,6,6>
-  2295221558U, // <3,6,3,7>: Cost 2 vmrglw <2,2,3,3>, RHS
-  2295221559U, // <3,6,3,u>: Cost 2 vmrglw <2,2,3,3>, RHS
-  3309326625U, // <3,6,4,0>: Cost 3 vmrghw <3,4,5,6>, <6,0,1,2>
+  2331054904U, // <3,6,3,6>: Cost 3 vmrglw <u,2,3,3>, <6,6,6,6>
+  1221479734U, // <3,6,3,7>: Cost 2 vmrglw <2,2,3,3>, RHS
+  1221479735U, // <3,6,3,u>: Cost 2 vmrglw <2,2,3,3>, RHS
+  2235584801U, // <3,6,4,0>: Cost 3 vmrghw <3,4,5,6>, <6,0,1,2>
   3717342106U, // <3,6,4,1>: Cost 4 vsldoi4 <4,3,6,4>, <1,2,3,4>
-  3862909553U, // <3,6,4,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,4,2,5>
-  3309326898U, // <3,6,4,3>: Cost 3 vmrghw <3,4,5,6>, <6,3,4,5>
-  3309326989U, // <3,6,4,4>: Cost 3 vmrghw <3,4,5,6>, <6,4,5,6>
-  3773631798U, // <3,6,4,5>: Cost 3 vsldoi8 <2,5,3,6>, RHS
-  3873821333U, // <3,6,4,6>: Cost 3 vsldoi12 LHS, <6,4,6,5>
-  2289257782U, // <3,6,4,7>: Cost 2 vmrglw <1,2,3,4>, RHS
-  2289257783U, // <3,6,4,u>: Cost 2 vmrglw <1,2,3,4>, RHS
+  2789167729U, // <3,6,4,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,4,2,5>
+  2235585074U, // <3,6,4,3>: Cost 3 vmrghw <3,4,5,6>, <6,3,4,5>
+  2235585165U, // <3,6,4,4>: Cost 3 vmrghw <3,4,5,6>, <6,4,5,6>
+  2699889974U, // <3,6,4,5>: Cost 3 vsldoi8 <2,5,3,6>, RHS
+  2800079509U, // <3,6,4,6>: Cost 3 vsldoi12 LHS, <6,4,6,5>
+  1215515958U, // <3,6,4,7>: Cost 2 vmrglw <1,2,3,4>, RHS
+  1215515959U, // <3,6,4,u>: Cost 2 vmrglw <1,2,3,4>, RHS
   3873821356U, // <3,6,5,0>: Cost 4 vsldoi12 LHS, <6,5,0,1>
   3372959209U, // <3,6,5,1>: Cost 5 vmrglw <2,u,3,5>, <2,0,6,1>
   3862909629U, // <3,6,5,2>: Cost 4 vsldoi12 <6,2,7,3>, <6,5,2,0>
@@ -2746,332 +2746,332 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3873821396U, // <3,6,5,4>: Cost 4 vsldoi12 LHS, <6,5,4,5>
   3873821405U, // <3,6,5,5>: Cost 4 vsldoi12 LHS, <6,5,5,5>
   3862909672U, // <3,6,5,6>: Cost 4 vsldoi12 <6,2,7,3>, <6,5,6,7>
-  3368316214U, // <3,6,5,7>: Cost 3 vmrglw <2,1,3,5>, RHS
-  3368316215U, // <3,6,5,u>: Cost 3 vmrglw <2,1,3,5>, RHS
-  3873821437U, // <3,6,6,0>: Cost 3 vsldoi12 LHS, <6,6,0,1>
+  2294574390U, // <3,6,5,7>: Cost 3 vmrglw <2,1,3,5>, RHS
+  2294574391U, // <3,6,5,u>: Cost 3 vmrglw <2,1,3,5>, RHS
+  2800079613U, // <3,6,6,0>: Cost 3 vsldoi12 LHS, <6,6,0,1>
   3873821446U, // <3,6,6,1>: Cost 4 vsldoi12 LHS, <6,6,1,1>
-  3862909712U, // <3,6,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,6,2,2>
+  2789167888U, // <3,6,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,6,2,2>
   3844920090U, // <3,6,6,3>: Cost 4 vsldoi12 <3,2,6,3>, <6,6,3,3>
-  3873821477U, // <3,6,6,4>: Cost 3 vsldoi12 LHS, <6,6,4,5>
+  2800079653U, // <3,6,6,4>: Cost 3 vsldoi12 LHS, <6,6,4,5>
   3723333484U, // <3,6,6,5>: Cost 4 vsldoi4 <5,3,6,6>, <5,3,6,6>
-  2800079672U, // <3,6,6,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
-  2800079682U, // <3,6,6,7>: Cost 2 vsldoi12 LHS, <6,6,7,7>
-  2800079691U, // <3,6,6,u>: Cost 2 vsldoi12 LHS, <6,6,u,7>
-  2800079694U, // <3,6,7,0>: Cost 2 vsldoi12 LHS, <6,7,0,1>
-  3371648489U, // <3,6,7,1>: Cost 3 vmrglw <2,6,3,7>, <2,0,6,1>
-  3865858914U, // <3,6,7,2>: Cost 3 vsldoi12 <6,7,2,3>, <6,7,2,3>
-  3371649382U, // <3,6,7,3>: Cost 3 vmrglw <2,6,3,7>, <3,2,6,3>
-  2800079734U, // <3,6,7,4>: Cost 2 vsldoi12 LHS, <6,7,4,5>
-  3371648817U, // <3,6,7,5>: Cost 3 vmrglw <2,6,3,7>, <2,4,6,5>
-  3371648656U, // <3,6,7,6>: Cost 3 vmrglw <2,6,3,7>, <2,2,6,6>
-  2297908534U, // <3,6,7,7>: Cost 2 vmrglw <2,6,3,7>, RHS
-  2297908535U, // <3,6,7,u>: Cost 2 vmrglw <2,6,3,7>, RHS
-  2800079775U, // <3,6,u,0>: Cost 2 vsldoi12 LHS, <6,u,0,1>
-  3773634350U, // <3,6,u,1>: Cost 3 vsldoi8 <2,5,3,6>, LHS
-  3862909873U, // <3,6,u,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,u,2,1>
-  3866596284U, // <3,6,u,3>: Cost 3 vsldoi12 <6,u,3,3>, <6,u,3,3>
-  2800079815U, // <3,6,u,4>: Cost 2 vsldoi12 LHS, <6,u,4,5>
-  3773634714U, // <3,6,u,5>: Cost 3 vsldoi8 <2,5,3,6>, RHS
-  2800079672U, // <3,6,u,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
-  2289290550U, // <3,6,u,7>: Cost 2 vmrglw <1,2,3,u>, RHS
-  2289290551U, // <3,6,u,u>: Cost 2 vmrglw <1,2,3,u>, RHS
-  3774300160U, // <3,7,0,0>: Cost 3 vsldoi8 <2,6,3,7>, <0,0,0,0>
-  2700558438U, // <3,7,0,1>: Cost 2 vsldoi8 <2,6,3,7>, LHS
-  3774300337U, // <3,7,0,2>: Cost 3 vsldoi8 <2,6,3,7>, <0,2,1,6>
-  3404771834U, // <3,7,0,3>: Cost 3 vmrglw <u,2,3,0>, <6,2,7,3>
-  3774300498U, // <3,7,0,4>: Cost 3 vsldoi8 <2,6,3,7>, <0,4,1,5>
-  3873821730U, // <3,7,0,5>: Cost 3 vsldoi12 LHS, <7,0,5,6>
-  3729330760U, // <3,7,0,6>: Cost 3 vsldoi4 <6,3,7,0>, <6,3,7,0>
-  3873821743U, // <3,7,0,7>: Cost 3 vsldoi12 LHS, <7,0,7,1>
-  2700559005U, // <3,7,0,u>: Cost 2 vsldoi8 <2,6,3,7>, LHS
+  1726337848U, // <3,6,6,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
+  1726337858U, // <3,6,6,7>: Cost 2 vsldoi12 LHS, <6,6,7,7>
+  1726337867U, // <3,6,6,u>: Cost 2 vsldoi12 LHS, <6,6,u,7>
+  1726337870U, // <3,6,7,0>: Cost 2 vsldoi12 LHS, <6,7,0,1>
+  2297906665U, // <3,6,7,1>: Cost 3 vmrglw <2,6,3,7>, <2,0,6,1>
+  2792117090U, // <3,6,7,2>: Cost 3 vsldoi12 <6,7,2,3>, <6,7,2,3>
+  2297907558U, // <3,6,7,3>: Cost 3 vmrglw <2,6,3,7>, <3,2,6,3>
+  1726337910U, // <3,6,7,4>: Cost 2 vsldoi12 LHS, <6,7,4,5>
+  2297906993U, // <3,6,7,5>: Cost 3 vmrglw <2,6,3,7>, <2,4,6,5>
+  2297906832U, // <3,6,7,6>: Cost 3 vmrglw <2,6,3,7>, <2,2,6,6>
+  1224166710U, // <3,6,7,7>: Cost 2 vmrglw <2,6,3,7>, RHS
+  1224166711U, // <3,6,7,u>: Cost 2 vmrglw <2,6,3,7>, RHS
+  1726337951U, // <3,6,u,0>: Cost 2 vsldoi12 LHS, <6,u,0,1>
+  2699892526U, // <3,6,u,1>: Cost 3 vsldoi8 <2,5,3,6>, LHS
+  2789168049U, // <3,6,u,2>: Cost 3 vsldoi12 <6,2,7,3>, <6,u,2,1>
+  2792854460U, // <3,6,u,3>: Cost 3 vsldoi12 <6,u,3,3>, <6,u,3,3>
+  1726337991U, // <3,6,u,4>: Cost 2 vsldoi12 LHS, <6,u,4,5>
+  2699892890U, // <3,6,u,5>: Cost 3 vsldoi8 <2,5,3,6>, RHS
+  1726337848U, // <3,6,u,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
+  1215548726U, // <3,6,u,7>: Cost 2 vmrglw <1,2,3,u>, RHS
+  1215548727U, // <3,6,u,u>: Cost 2 vmrglw <1,2,3,u>, RHS
+  2700558336U, // <3,7,0,0>: Cost 3 vsldoi8 <2,6,3,7>, <0,0,0,0>
+  1626816614U, // <3,7,0,1>: Cost 2 vsldoi8 <2,6,3,7>, LHS
+  2700558513U, // <3,7,0,2>: Cost 3 vsldoi8 <2,6,3,7>, <0,2,1,6>
+  2331030010U, // <3,7,0,3>: Cost 3 vmrglw <u,2,3,0>, <6,2,7,3>
+  2700558674U, // <3,7,0,4>: Cost 3 vsldoi8 <2,6,3,7>, <0,4,1,5>
+  2800079906U, // <3,7,0,5>: Cost 3 vsldoi12 LHS, <7,0,5,6>
+  2655588936U, // <3,7,0,6>: Cost 3 vsldoi4 <6,3,7,0>, <6,3,7,0>
+  2800079919U, // <3,7,0,7>: Cost 3 vsldoi12 LHS, <7,0,7,1>
+  1626817181U, // <3,7,0,u>: Cost 2 vsldoi8 <2,6,3,7>, LHS
   3774300899U, // <3,7,1,0>: Cost 4 vsldoi8 <2,6,3,7>, <1,0,1,1>
-  3774300980U, // <3,7,1,1>: Cost 3 vsldoi8 <2,6,3,7>, <1,1,1,1>
-  3774301078U, // <3,7,1,2>: Cost 3 vsldoi8 <2,6,3,7>, <1,2,3,0>
+  2700559156U, // <3,7,1,1>: Cost 3 vsldoi8 <2,6,3,7>, <1,1,1,1>
+  2700559254U, // <3,7,1,2>: Cost 3 vsldoi8 <2,6,3,7>, <1,2,3,0>
   3774301148U, // <3,7,1,3>: Cost 4 vsldoi8 <2,6,3,7>, <1,3,1,7>
   3774301227U, // <3,7,1,4>: Cost 4 vsldoi8 <2,6,3,7>, <1,4,1,5>
   3774301295U, // <3,7,1,5>: Cost 4 vsldoi8 <2,6,3,7>, <1,5,0,1>
   3768329441U, // <3,7,1,6>: Cost 4 vsldoi8 <1,6,3,7>, <1,6,3,7>
   3403453250U, // <3,7,1,7>: Cost 4 vmrglw <u,0,3,1>, <6,6,7,7>
-  3774301564U, // <3,7,1,u>: Cost 3 vsldoi8 <2,6,3,7>, <1,u,3,0>
-  3774301673U, // <3,7,2,0>: Cost 3 vsldoi8 <2,6,3,7>, <2,0,6,1>
+  2700559740U, // <3,7,1,u>: Cost 3 vsldoi8 <2,6,3,7>, <1,u,3,0>
+  2700559849U, // <3,7,2,0>: Cost 3 vsldoi8 <2,6,3,7>, <2,0,6,1>
   3770983973U, // <3,7,2,1>: Cost 4 vsldoi8 <2,1,3,7>, <2,1,3,7>
-  3774301800U, // <3,7,2,2>: Cost 3 vsldoi8 <2,6,3,7>, <2,2,2,2>
-  3772311239U, // <3,7,2,3>: Cost 3 vsldoi8 <2,3,3,7>, <2,3,3,7>
-  3774302001U, // <3,7,2,4>: Cost 3 vsldoi8 <2,6,3,7>, <2,4,6,5>
+  2700559976U, // <3,7,2,2>: Cost 3 vsldoi8 <2,6,3,7>, <2,2,2,2>
+  2698569415U, // <3,7,2,3>: Cost 3 vsldoi8 <2,3,3,7>, <2,3,3,7>
+  2700560177U, // <3,7,2,4>: Cost 3 vsldoi8 <2,6,3,7>, <2,4,6,5>
   3773638505U, // <3,7,2,5>: Cost 4 vsldoi8 <2,5,3,7>, <2,5,3,7>
-  2700560314U, // <3,7,2,6>: Cost 2 vsldoi8 <2,6,3,7>, <2,6,3,7>
-  3868882131U, // <3,7,2,7>: Cost 3 vsldoi12 <7,2,7,3>, <7,2,7,3>
-  2701887580U, // <3,7,2,u>: Cost 2 vsldoi8 <2,u,3,7>, <2,u,3,7>
-  3774302358U, // <3,7,3,0>: Cost 3 vsldoi8 <2,6,3,7>, <3,0,1,2>
+  1626818490U, // <3,7,2,6>: Cost 2 vsldoi8 <2,6,3,7>, <2,6,3,7>
+  2795140307U, // <3,7,2,7>: Cost 3 vsldoi12 <7,2,7,3>, <7,2,7,3>
+  1628145756U, // <3,7,2,u>: Cost 2 vsldoi8 <2,u,3,7>, <2,u,3,7>
+  2700560534U, // <3,7,3,0>: Cost 3 vsldoi8 <2,6,3,7>, <3,0,1,2>
   3774302438U, // <3,7,3,1>: Cost 4 vsldoi8 <2,6,3,7>, <3,1,1,1>
-  3774302566U, // <3,7,3,2>: Cost 3 vsldoi8 <2,6,3,7>, <3,2,6,3>
-  3774302620U, // <3,7,3,3>: Cost 3 vsldoi8 <2,6,3,7>, <3,3,3,3>
-  3774302722U, // <3,7,3,4>: Cost 3 vsldoi8 <2,6,3,7>, <3,4,5,6>
+  2700560742U, // <3,7,3,2>: Cost 3 vsldoi8 <2,6,3,7>, <3,2,6,3>
+  2700560796U, // <3,7,3,3>: Cost 3 vsldoi8 <2,6,3,7>, <3,3,3,3>
+  2700560898U, // <3,7,3,4>: Cost 3 vsldoi8 <2,6,3,7>, <3,4,5,6>
   3774302821U, // <3,7,3,5>: Cost 4 vsldoi8 <2,6,3,7>, <3,5,7,6>
-  3774302903U, // <3,7,3,6>: Cost 3 vsldoi8 <2,6,3,7>, <3,6,7,7>
-  3774302915U, // <3,7,3,7>: Cost 3 vsldoi8 <2,6,3,7>, <3,7,0,1>
-  3774303006U, // <3,7,3,u>: Cost 3 vsldoi8 <2,6,3,7>, <3,u,1,2>
-  3729358950U, // <3,7,4,0>: Cost 3 vsldoi4 <6,3,7,4>, LHS
+  2700561079U, // <3,7,3,6>: Cost 3 vsldoi8 <2,6,3,7>, <3,6,7,7>
+  2700561091U, // <3,7,3,7>: Cost 3 vsldoi8 <2,6,3,7>, <3,7,0,1>
+  2700561182U, // <3,7,3,u>: Cost 3 vsldoi8 <2,6,3,7>, <3,u,1,2>
+  2655617126U, // <3,7,4,0>: Cost 3 vsldoi4 <6,3,7,4>, LHS
   3774303178U, // <3,7,4,1>: Cost 4 vsldoi8 <2,6,3,7>, <4,1,2,3>
-  3729360826U, // <3,7,4,2>: Cost 3 vsldoi4 <6,3,7,4>, <2,6,3,7>
-  3404804602U, // <3,7,4,3>: Cost 3 vmrglw <u,2,3,4>, <6,2,7,3>
-  3729362230U, // <3,7,4,4>: Cost 3 vsldoi4 <6,3,7,4>, RHS
-  2700561718U, // <3,7,4,5>: Cost 2 vsldoi8 <2,6,3,7>, RHS
-  3729363532U, // <3,7,4,6>: Cost 3 vsldoi4 <6,3,7,4>, <6,3,7,4>
-  3873822071U, // <3,7,4,7>: Cost 3 vsldoi12 LHS, <7,4,7,5>
-  2700561961U, // <3,7,4,u>: Cost 2 vsldoi8 <2,6,3,7>, RHS
+  2655619002U, // <3,7,4,2>: Cost 3 vsldoi4 <6,3,7,4>, <2,6,3,7>
+  2331062778U, // <3,7,4,3>: Cost 3 vmrglw <u,2,3,4>, <6,2,7,3>
+  2655620406U, // <3,7,4,4>: Cost 3 vsldoi4 <6,3,7,4>, RHS
+  1626819894U, // <3,7,4,5>: Cost 2 vsldoi8 <2,6,3,7>, RHS
+  2655621708U, // <3,7,4,6>: Cost 3 vsldoi4 <6,3,7,4>, <6,3,7,4>
+  2800080247U, // <3,7,4,7>: Cost 3 vsldoi12 LHS, <7,4,7,5>
+  1626820137U, // <3,7,4,u>: Cost 2 vsldoi8 <2,6,3,7>, RHS
   3774303816U, // <3,7,5,0>: Cost 4 vsldoi8 <2,6,3,7>, <5,0,1,2>
   3873822093U, // <3,7,5,1>: Cost 4 vsldoi12 LHS, <7,5,1,0>
   3774303998U, // <3,7,5,2>: Cost 4 vsldoi8 <2,6,3,7>, <5,2,3,4>
   3862910368U, // <3,7,5,3>: Cost 4 vsldoi12 <6,2,7,3>, <7,5,3,1>
   3774304180U, // <3,7,5,4>: Cost 4 vsldoi8 <2,6,3,7>, <5,4,5,6>
-  3873822134U, // <3,7,5,5>: Cost 3 vsldoi12 LHS, <7,5,5,5>
-  3873822145U, // <3,7,5,6>: Cost 3 vsldoi12 LHS, <7,5,6,7>
+  2800080310U, // <3,7,5,5>: Cost 3 vsldoi12 LHS, <7,5,5,5>
+  2800080321U, // <3,7,5,6>: Cost 3 vsldoi12 LHS, <7,5,6,7>
   3873822147U, // <3,7,5,7>: Cost 4 vsldoi12 LHS, <7,5,7,0>
-  3873822163U, // <3,7,5,u>: Cost 3 vsldoi12 LHS, <7,5,u,7>
-  3873822172U, // <3,7,6,0>: Cost 3 vsldoi12 LHS, <7,6,0,7>
+  2800080339U, // <3,7,5,u>: Cost 3 vsldoi12 LHS, <7,5,u,7>
+  2800080348U, // <3,7,6,0>: Cost 3 vsldoi12 LHS, <7,6,0,7>
   3873822181U, // <3,7,6,1>: Cost 4 vsldoi12 LHS, <7,6,1,7>
-  3862910446U, // <3,7,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <7,6,2,7>
-  3774304840U, // <3,7,6,3>: Cost 3 vsldoi8 <2,6,3,7>, <6,3,7,0>
-  3873822208U, // <3,7,6,4>: Cost 3 vsldoi12 LHS, <7,6,4,7>
+  2789168622U, // <3,7,6,2>: Cost 3 vsldoi12 <6,2,7,3>, <7,6,2,7>
+  2700563016U, // <3,7,6,3>: Cost 3 vsldoi8 <2,6,3,7>, <6,3,7,0>
+  2800080384U, // <3,7,6,4>: Cost 3 vsldoi12 LHS, <7,6,4,7>
   3862910472U, // <3,7,6,5>: Cost 4 vsldoi12 <6,2,7,3>, <7,6,5,6>
-  3774305080U, // <3,7,6,6>: Cost 3 vsldoi8 <2,6,3,7>, <6,6,6,6>
-  3873822228U, // <3,7,6,7>: Cost 3 vsldoi12 LHS, <7,6,7,0>
-  3866891812U, // <3,7,6,u>: Cost 3 vsldoi12 <6,u,7,3>, <7,6,u,7>
-  3711467622U, // <3,7,7,0>: Cost 3 vsldoi4 <3,3,7,7>, LHS
+  2700563256U, // <3,7,6,6>: Cost 3 vsldoi8 <2,6,3,7>, <6,6,6,6>
+  2800080404U, // <3,7,6,7>: Cost 3 vsldoi12 LHS, <7,6,7,0>
+  2793149988U, // <3,7,6,u>: Cost 3 vsldoi12 <6,u,7,3>, <7,6,u,7>
+  2637725798U, // <3,7,7,0>: Cost 3 vsldoi4 <3,3,7,7>, LHS
   3371649227U, // <3,7,7,1>: Cost 4 vmrglw <2,6,3,7>, <3,0,7,1>
-  3711469498U, // <3,7,7,2>: Cost 3 vsldoi4 <3,3,7,7>, <2,6,3,7>
-  3371649391U, // <3,7,7,3>: Cost 3 vmrglw <2,6,3,7>, <3,2,7,3>
-  3711470902U, // <3,7,7,4>: Cost 3 vsldoi4 <3,3,7,7>, RHS
+  2637727674U, // <3,7,7,2>: Cost 3 vsldoi4 <3,3,7,7>, <2,6,3,7>
+  2297907567U, // <3,7,7,3>: Cost 3 vmrglw <2,6,3,7>, <3,2,7,3>
+  2637729078U, // <3,7,7,4>: Cost 3 vsldoi4 <3,3,7,7>, RHS
   3371649312U, // <3,7,7,5>: Cost 4 vmrglw <2,6,3,7>, <3,1,7,5>
-  3729388111U, // <3,7,7,6>: Cost 3 vsldoi4 <6,3,7,7>, <6,3,7,7>
-  2800080492U, // <3,7,7,7>: Cost 2 vsldoi12 LHS, <7,7,7,7>
-  2800080492U, // <3,7,7,u>: Cost 2 vsldoi12 LHS, <7,7,7,7>
-  3774306003U, // <3,7,u,0>: Cost 3 vsldoi8 <2,6,3,7>, <u,0,1,2>
-  2700564270U, // <3,7,u,1>: Cost 2 vsldoi8 <2,6,3,7>, LHS
-  3774306181U, // <3,7,u,2>: Cost 3 vsldoi8 <2,6,3,7>, <u,2,3,0>
-  3774306236U, // <3,7,u,3>: Cost 3 vsldoi8 <2,6,3,7>, <u,3,0,1>
-  3774306367U, // <3,7,u,4>: Cost 3 vsldoi8 <2,6,3,7>, <u,4,5,6>
-  2700564634U, // <3,7,u,5>: Cost 2 vsldoi8 <2,6,3,7>, RHS
-  2736396496U, // <3,7,u,6>: Cost 2 vsldoi8 <u,6,3,7>, <u,6,3,7>
-  2800080492U, // <3,7,u,7>: Cost 2 vsldoi12 LHS, <7,7,7,7>
-  2700564837U, // <3,7,u,u>: Cost 2 vsldoi8 <2,6,3,7>, LHS
-  2752299008U, // <3,u,0,0>: Cost 2 vsldoi12 LHS, <0,0,0,0>
-  2752747219U, // <3,u,0,1>: Cost 2 vsldoi12 LHS, <u,0,1,2>
-  3362963611U, // <3,u,0,2>: Cost 3 vmrglw <1,2,3,0>, <0,1,u,2>
-  2289221788U, // <3,u,0,3>: Cost 2 vmrglw <1,2,3,0>, LHS
-  3826489069U, // <3,u,0,4>: Cost 3 vsldoi12 LHS, <u,0,4,1>
-  2232604826U, // <3,u,0,5>: Cost 2 vmrghw <3,0,1,2>, RHS
-  3362966045U, // <3,u,0,6>: Cost 3 vmrglw <1,2,3,0>, <3,4,u,6>
-  2289225032U, // <3,u,0,7>: Cost 2 vmrglw <1,2,3,0>, RHS
-  2752747282U, // <3,u,0,u>: Cost 2 vsldoi12 LHS, <u,0,u,2>
-  2631778406U, // <3,u,1,0>: Cost 2 vsldoi4 <2,3,u,1>, LHS
-  2752299828U, // <3,u,1,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
-  1678563118U, // <3,u,1,2>: Cost 1 vsldoi12 LHS, LHS
-  3826489141U, // <3,u,1,3>: Cost 3 vsldoi12 LHS, <u,1,3,1>
-  2631781686U, // <3,u,1,4>: Cost 2 vsldoi4 <2,3,u,1>, RHS
-  3830691654U, // <3,u,1,5>: Cost 3 vsldoi12 LHS, <u,1,5,0>
-  3873822550U, // <3,u,1,6>: Cost 3 vsldoi12 LHS, <u,1,6,7>
-  3362975048U, // <3,u,1,7>: Cost 3 vmrglw <1,2,3,1>, RHS
-  1678563172U, // <3,u,1,u>: Cost 1 vsldoi12 LHS, LHS
-  3770328533U, // <3,u,2,0>: Cost 3 vsldoi8 <2,0,3,u>, <2,0,3,u>
-  3831134070U, // <3,u,2,1>: Cost 3 vsldoi12 LHS, <u,2,1,3>
-  2697913975U, // <3,u,2,2>: Cost 2 vsldoi8 <2,2,3,u>, <2,2,3,u>
-  2752747400U, // <3,u,2,3>: Cost 2 vsldoi12 LHS, <u,2,3,3>
-  3705531702U, // <3,u,2,4>: Cost 3 vsldoi4 <2,3,u,2>, RHS
-  3773646698U, // <3,u,2,5>: Cost 3 vsldoi8 <2,5,3,u>, <2,5,3,u>
-  2700568507U, // <3,u,2,6>: Cost 2 vsldoi8 <2,6,3,u>, <2,6,3,u>
-  2800080812U, // <3,u,2,7>: Cost 2 vsldoi12 LHS, <u,2,7,3>
-  2756949941U, // <3,u,2,u>: Cost 2 vsldoi12 LHS, <u,2,u,3>
-  2752747452U, // <3,u,3,0>: Cost 2 vsldoi12 LHS, <u,3,0,1>
-  2234750766U, // <3,u,3,1>: Cost 2 vmrghw <3,3,3,3>, LHS
-  3826489295U, // <3,u,3,2>: Cost 3 vsldoi12 LHS, <u,3,2,2>
-  1477230694U, // <3,u,3,3>: Cost 1 vspltisw3 LHS
-  2752747492U, // <3,u,3,4>: Cost 2 vsldoi12 LHS, <u,3,4,5>
-  2234751130U, // <3,u,3,5>: Cost 2 vmrghw <3,3,3,3>, RHS
-  3765684928U, // <3,u,3,6>: Cost 3 vsldoi8 <1,2,3,u>, <3,6,u,7>
-  2295221576U, // <3,u,3,7>: Cost 2 vmrglw <2,2,3,3>, RHS
-  1477230694U, // <3,u,3,u>: Cost 1 vspltisw3 LHS
-  3362997187U, // <3,u,4,0>: Cost 3 vmrglw <1,2,3,4>, <1,2,u,0>
-  2235586350U, // <3,u,4,1>: Cost 2 vmrghw <3,4,5,6>, LHS
-  3362998485U, // <3,u,4,2>: Cost 3 vmrglw <1,2,3,4>, <3,0,u,2>
-  2289254556U, // <3,u,4,3>: Cost 2 vmrglw <1,2,3,4>, LHS
-  2289255322U, // <3,u,4,4>: Cost 2 vmrglw <1,2,3,4>, <1,2,3,4>
-  2752747583U, // <3,u,4,5>: Cost 2 vsldoi12 LHS, <u,4,5,6>
-  3362998813U, // <3,u,4,6>: Cost 3 vmrglw <1,2,3,4>, <3,4,u,6>
-  2289257800U, // <3,u,4,7>: Cost 2 vmrglw <1,2,3,4>, RHS
-  2752747610U, // <3,u,4,u>: Cost 2 vsldoi12 LHS, <u,4,u,6>
-  2631811174U, // <3,u,5,0>: Cost 2 vsldoi4 <2,3,u,5>, LHS
-  3705553716U, // <3,u,5,1>: Cost 3 vsldoi4 <2,3,u,5>, <1,1,1,1>
-  2631812850U, // <3,u,5,2>: Cost 2 vsldoi4 <2,3,u,5>, <2,3,u,5>
-  3826489470U, // <3,u,5,3>: Cost 3 vsldoi12 LHS, <u,5,3,6>
-  2631814454U, // <3,u,5,4>: Cost 2 vsldoi4 <2,3,u,5>, RHS
-  2800078852U, // <3,u,5,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
-  1678563482U, // <3,u,5,6>: Cost 1 vsldoi12 LHS, RHS
-  3368316232U, // <3,u,5,7>: Cost 3 vmrglw <2,1,3,5>, RHS
-  1678563500U, // <3,u,5,u>: Cost 1 vsldoi12 LHS, RHS
-  3705561190U, // <3,u,6,0>: Cost 3 vsldoi4 <2,3,u,6>, LHS
-  3831134398U, // <3,u,6,1>: Cost 3 vsldoi12 LHS, <u,6,1,7>
-  3705562867U, // <3,u,6,2>: Cost 3 vsldoi4 <2,3,u,6>, <2,3,u,6>
-  2752747728U, // <3,u,6,3>: Cost 2 vsldoi12 LHS, <u,6,3,7>
-  3705564470U, // <3,u,6,4>: Cost 3 vsldoi4 <2,3,u,6>, RHS
-  3310295194U, // <3,u,6,5>: Cost 3 vmrghw <3,6,0,7>, RHS
-  2800079672U, // <3,u,6,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
-  2800081133U, // <3,u,6,7>: Cost 2 vsldoi12 LHS, <u,6,7,0>
-  2756950269U, // <3,u,6,u>: Cost 2 vsldoi12 LHS, <u,6,u,7>
-  2800081152U, // <3,u,7,0>: Cost 2 vsldoi12 LHS, <u,7,0,1>
-  3371647049U, // <3,u,7,1>: Cost 3 vmrglw <2,6,3,7>, <0,0,u,1>
-  3705571060U, // <3,u,7,2>: Cost 3 vsldoi4 <2,3,u,7>, <2,3,u,7>
-  2297905308U, // <3,u,7,3>: Cost 2 vmrglw <2,6,3,7>, LHS
-  2800081192U, // <3,u,7,4>: Cost 2 vsldoi12 LHS, <u,7,4,5>
-  3371647377U, // <3,u,7,5>: Cost 3 vmrglw <2,6,3,7>, <0,4,u,5>
-  3371647216U, // <3,u,7,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,u,6>
-  2297908552U, // <3,u,7,7>: Cost 2 vmrglw <2,6,3,7>, RHS
-  2297905313U, // <3,u,7,u>: Cost 2 vmrglw <2,6,3,7>, LHS
-  2756950353U, // <3,u,u,0>: Cost 2 vsldoi12 LHS, <u,u,0,1>
-  2752747867U, // <3,u,u,1>: Cost 2 vsldoi12 LHS, <u,u,1,2>
-  1678563685U, // <3,u,u,2>: Cost 1 vsldoi12 LHS, LHS
-  1477230694U, // <3,u,u,3>: Cost 1 vspltisw3 LHS
-  2756950393U, // <3,u,u,4>: Cost 2 vsldoi12 LHS, <u,u,4,5>
-  2752747907U, // <3,u,u,5>: Cost 2 vsldoi12 LHS, <u,u,5,6>
-  1678563725U, // <3,u,u,6>: Cost 1 vsldoi12 LHS, RHS
-  2289290568U, // <3,u,u,7>: Cost 2 vmrglw <1,2,3,u>, RHS
-  1678563739U, // <3,u,u,u>: Cost 1 vsldoi12 LHS, LHS
-  3832758272U, // <4,0,0,0>: Cost 3 vsldoi12 <1,2,3,4>, <0,0,0,0>
-  2238857318U, // <4,0,0,1>: Cost 2 vmrghw <4,0,5,1>, LHS
+  2655646287U, // <3,7,7,6>: Cost 3 vsldoi4 <6,3,7,7>, <6,3,7,7>
+  1726338668U, // <3,7,7,7>: Cost 2 vsldoi12 LHS, <7,7,7,7>
+  1726338668U, // <3,7,7,u>: Cost 2 vsldoi12 LHS, <7,7,7,7>
+  2700564179U, // <3,7,u,0>: Cost 3 vsldoi8 <2,6,3,7>, <u,0,1,2>
+  1626822446U, // <3,7,u,1>: Cost 2 vsldoi8 <2,6,3,7>, LHS
+  2700564357U, // <3,7,u,2>: Cost 3 vsldoi8 <2,6,3,7>, <u,2,3,0>
+  2700564412U, // <3,7,u,3>: Cost 3 vsldoi8 <2,6,3,7>, <u,3,0,1>
+  2700564543U, // <3,7,u,4>: Cost 3 vsldoi8 <2,6,3,7>, <u,4,5,6>
+  1626822810U, // <3,7,u,5>: Cost 2 vsldoi8 <2,6,3,7>, RHS
+  1662654672U, // <3,7,u,6>: Cost 2 vsldoi8 <u,6,3,7>, <u,6,3,7>
+  1726338668U, // <3,7,u,7>: Cost 2 vsldoi12 LHS, <7,7,7,7>
+  1626823013U, // <3,7,u,u>: Cost 2 vsldoi8 <2,6,3,7>, LHS
+  1678557184U, // <3,u,0,0>: Cost 2 vsldoi12 LHS, <0,0,0,0>
+  1679005395U, // <3,u,0,1>: Cost 2 vsldoi12 LHS, <u,0,1,2>
+  2289221787U, // <3,u,0,2>: Cost 3 vmrglw <1,2,3,0>, <0,1,u,2>
+  1215479964U, // <3,u,0,3>: Cost 2 vmrglw <1,2,3,0>, LHS
+  2752747245U, // <3,u,0,4>: Cost 3 vsldoi12 LHS, <u,0,4,1>
+  1158863002U, // <3,u,0,5>: Cost 2 vmrghw <3,0,1,2>, RHS
+  2289224221U, // <3,u,0,6>: Cost 3 vmrglw <1,2,3,0>, <3,4,u,6>
+  1215483208U, // <3,u,0,7>: Cost 2 vmrglw <1,2,3,0>, RHS
+  1679005458U, // <3,u,0,u>: Cost 2 vsldoi12 LHS, <u,0,u,2>
+  1558036582U, // <3,u,1,0>: Cost 2 vsldoi4 <2,3,u,1>, LHS
+  1678558004U, // <3,u,1,1>: Cost 2 vsldoi12 LHS, <1,1,1,1>
+  604821294U,  // <3,u,1,2>: Cost 1 vsldoi12 LHS, LHS
+  2752747317U, // <3,u,1,3>: Cost 3 vsldoi12 LHS, <u,1,3,1>
+  1558039862U, // <3,u,1,4>: Cost 2 vsldoi4 <2,3,u,1>, RHS
+  2756949830U, // <3,u,1,5>: Cost 3 vsldoi12 LHS, <u,1,5,0>
+  2800080726U, // <3,u,1,6>: Cost 3 vsldoi12 LHS, <u,1,6,7>
+  2289233224U, // <3,u,1,7>: Cost 3 vmrglw <1,2,3,1>, RHS
+  604821348U,  // <3,u,1,u>: Cost 1 vsldoi12 LHS, LHS
+  2696586709U, // <3,u,2,0>: Cost 3 vsldoi8 <2,0,3,u>, <2,0,3,u>
+  2757392246U, // <3,u,2,1>: Cost 3 vsldoi12 LHS, <u,2,1,3>
+  1624172151U, // <3,u,2,2>: Cost 2 vsldoi8 <2,2,3,u>, <2,2,3,u>
+  1679005576U, // <3,u,2,3>: Cost 2 vsldoi12 LHS, <u,2,3,3>
+  2631789878U, // <3,u,2,4>: Cost 3 vsldoi4 <2,3,u,2>, RHS
+  2699904874U, // <3,u,2,5>: Cost 3 vsldoi8 <2,5,3,u>, <2,5,3,u>
+  1626826683U, // <3,u,2,6>: Cost 2 vsldoi8 <2,6,3,u>, <2,6,3,u>
+  1726338988U, // <3,u,2,7>: Cost 2 vsldoi12 LHS, <u,2,7,3>
+  1683208117U, // <3,u,2,u>: Cost 2 vsldoi12 LHS, <u,2,u,3>
+  1679005628U, // <3,u,3,0>: Cost 2 vsldoi12 LHS, <u,3,0,1>
+  1161008942U, // <3,u,3,1>: Cost 2 vmrghw <3,3,3,3>, LHS
+  2752747471U, // <3,u,3,2>: Cost 3 vsldoi12 LHS, <u,3,2,2>
+  403488870U,  // <3,u,3,3>: Cost 1 vspltisw3 LHS
+  1679005668U, // <3,u,3,4>: Cost 2 vsldoi12 LHS, <u,3,4,5>
+  1161009306U, // <3,u,3,5>: Cost 2 vmrghw <3,3,3,3>, RHS
+  2691943104U, // <3,u,3,6>: Cost 3 vsldoi8 <1,2,3,u>, <3,6,u,7>
+  1221479752U, // <3,u,3,7>: Cost 2 vmrglw <2,2,3,3>, RHS
+  403488870U,  // <3,u,3,u>: Cost 1 vspltisw3 LHS
+  2289255363U, // <3,u,4,0>: Cost 3 vmrglw <1,2,3,4>, <1,2,u,0>
+  1161844526U, // <3,u,4,1>: Cost 2 vmrghw <3,4,5,6>, LHS
+  2289256661U, // <3,u,4,2>: Cost 3 vmrglw <1,2,3,4>, <3,0,u,2>
+  1215512732U, // <3,u,4,3>: Cost 2 vmrglw <1,2,3,4>, LHS
+  1215513498U, // <3,u,4,4>: Cost 2 vmrglw <1,2,3,4>, <1,2,3,4>
+  1679005759U, // <3,u,4,5>: Cost 2 vsldoi12 LHS, <u,4,5,6>
+  2289256989U, // <3,u,4,6>: Cost 3 vmrglw <1,2,3,4>, <3,4,u,6>
+  1215515976U, // <3,u,4,7>: Cost 2 vmrglw <1,2,3,4>, RHS
+  1679005786U, // <3,u,4,u>: Cost 2 vsldoi12 LHS, <u,4,u,6>
+  1558069350U, // <3,u,5,0>: Cost 2 vsldoi4 <2,3,u,5>, LHS
+  2631811892U, // <3,u,5,1>: Cost 3 vsldoi4 <2,3,u,5>, <1,1,1,1>
+  1558071026U, // <3,u,5,2>: Cost 2 vsldoi4 <2,3,u,5>, <2,3,u,5>
+  2752747646U, // <3,u,5,3>: Cost 3 vsldoi12 LHS, <u,5,3,6>
+  1558072630U, // <3,u,5,4>: Cost 2 vsldoi4 <2,3,u,5>, RHS
+  1726337028U, // <3,u,5,5>: Cost 2 vsldoi12 LHS, <5,5,5,5>
+  604821658U,  // <3,u,5,6>: Cost 1 vsldoi12 LHS, RHS
+  2294574408U, // <3,u,5,7>: Cost 3 vmrglw <2,1,3,5>, RHS
+  604821676U,  // <3,u,5,u>: Cost 1 vsldoi12 LHS, RHS
+  2631819366U, // <3,u,6,0>: Cost 3 vsldoi4 <2,3,u,6>, LHS
+  2757392574U, // <3,u,6,1>: Cost 3 vsldoi12 LHS, <u,6,1,7>
+  2631821043U, // <3,u,6,2>: Cost 3 vsldoi4 <2,3,u,6>, <2,3,u,6>
+  1679005904U, // <3,u,6,3>: Cost 2 vsldoi12 LHS, <u,6,3,7>
+  2631822646U, // <3,u,6,4>: Cost 3 vsldoi4 <2,3,u,6>, RHS
+  2236553370U, // <3,u,6,5>: Cost 3 vmrghw <3,6,0,7>, RHS
+  1726337848U, // <3,u,6,6>: Cost 2 vsldoi12 LHS, <6,6,6,6>
+  1726339309U, // <3,u,6,7>: Cost 2 vsldoi12 LHS, <u,6,7,0>
+  1683208445U, // <3,u,6,u>: Cost 2 vsldoi12 LHS, <u,6,u,7>
+  1726339328U, // <3,u,7,0>: Cost 2 vsldoi12 LHS, <u,7,0,1>
+  2297905225U, // <3,u,7,1>: Cost 3 vmrglw <2,6,3,7>, <0,0,u,1>
+  2631829236U, // <3,u,7,2>: Cost 3 vsldoi4 <2,3,u,7>, <2,3,u,7>
+  1224163484U, // <3,u,7,3>: Cost 2 vmrglw <2,6,3,7>, LHS
+  1726339368U, // <3,u,7,4>: Cost 2 vsldoi12 LHS, <u,7,4,5>
+  2297905553U, // <3,u,7,5>: Cost 3 vmrglw <2,6,3,7>, <0,4,u,5>
+  2297905392U, // <3,u,7,6>: Cost 3 vmrglw <2,6,3,7>, <0,2,u,6>
+  1224166728U, // <3,u,7,7>: Cost 2 vmrglw <2,6,3,7>, RHS
+  1224163489U, // <3,u,7,u>: Cost 2 vmrglw <2,6,3,7>, LHS
+  1683208529U, // <3,u,u,0>: Cost 2 vsldoi12 LHS, <u,u,0,1>
+  1679006043U, // <3,u,u,1>: Cost 2 vsldoi12 LHS, <u,u,1,2>
+  604821861U,  // <3,u,u,2>: Cost 1 vsldoi12 LHS, LHS
+  403488870U,  // <3,u,u,3>: Cost 1 vspltisw3 LHS
+  1683208569U, // <3,u,u,4>: Cost 2 vsldoi12 LHS, <u,u,4,5>
+  1679006083U, // <3,u,u,5>: Cost 2 vsldoi12 LHS, <u,u,5,6>
+  604821901U,  // <3,u,u,6>: Cost 1 vsldoi12 LHS, RHS
+  1215548744U, // <3,u,u,7>: Cost 2 vmrglw <1,2,3,u>, RHS
+  604821915U,  // <3,u,u,u>: Cost 1 vsldoi12 LHS, LHS
+  2759016448U, // <4,0,0,0>: Cost 3 vsldoi12 <1,2,3,4>, <0,0,0,0>
+  1165115494U, // <4,0,0,1>: Cost 2 vmrghw <4,0,5,1>, LHS
   3717531337U, // <4,0,0,2>: Cost 4 vsldoi4 <4,4,0,0>, <2,3,4,0>
   3369675785U, // <4,0,0,3>: Cost 4 vmrglw <2,3,4,0>, <4,2,0,3>
-  3825532968U, // <4,0,0,4>: Cost 3 vsldoi12 <0,0,4,4>, <0,0,4,4>
-  3312599454U, // <4,0,0,5>: Cost 3 vmrghw <4,0,5,1>, <0,5,1,0>
+  2751791144U, // <4,0,0,4>: Cost 3 vsldoi12 <0,0,4,4>, <0,0,4,4>
+  2238857630U, // <4,0,0,5>: Cost 3 vmrghw <4,0,5,1>, <0,5,1,0>
   3312591341U, // <4,0,0,6>: Cost 4 vmrghw <4,0,5,0>, <0,6,0,7>
   3369676113U, // <4,0,0,7>: Cost 4 vmrglw <2,3,4,0>, <4,6,0,7>
-  2238857885U, // <4,0,0,u>: Cost 2 vmrghw <4,0,5,1>, LHS
-  3711565926U, // <4,0,1,0>: Cost 3 vsldoi4 <3,4,0,1>, LHS
-  3711566746U, // <4,0,1,1>: Cost 3 vsldoi4 <3,4,0,1>, <1,2,3,4>
-  2759016550U, // <4,0,1,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
-  3711568336U, // <4,0,1,3>: Cost 3 vsldoi4 <3,4,0,1>, <3,4,0,1>
-  3711569206U, // <4,0,1,4>: Cost 3 vsldoi4 <3,4,0,1>, RHS
-  3735457894U, // <4,0,1,5>: Cost 3 vsldoi4 <7,4,0,1>, <5,6,7,4>
+  1165116061U, // <4,0,0,u>: Cost 2 vmrghw <4,0,5,1>, LHS
+  2637824102U, // <4,0,1,0>: Cost 3 vsldoi4 <3,4,0,1>, LHS
+  2637824922U, // <4,0,1,1>: Cost 3 vsldoi4 <3,4,0,1>, <1,2,3,4>
+  1685274726U, // <4,0,1,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  2637826512U, // <4,0,1,3>: Cost 3 vsldoi4 <3,4,0,1>, <3,4,0,1>
+  2637827382U, // <4,0,1,4>: Cost 3 vsldoi4 <3,4,0,1>, RHS
+  2661716070U, // <4,0,1,5>: Cost 3 vsldoi4 <7,4,0,1>, <5,6,7,4>
   3729486427U, // <4,0,1,6>: Cost 4 vsldoi4 <6,4,0,1>, <6,4,0,1>
-  3735459124U, // <4,0,1,7>: Cost 3 vsldoi4 <7,4,0,1>, <7,4,0,1>
-  2759016604U, // <4,0,1,u>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  2661717300U, // <4,0,1,7>: Cost 3 vsldoi4 <7,4,0,1>, <7,4,0,1>
+  1685274780U, // <4,0,1,u>: Cost 2 vsldoi12 <1,2,3,4>, LHS
   3711574118U, // <4,0,2,0>: Cost 4 vsldoi4 <3,4,0,2>, LHS
-  3313942630U, // <4,0,2,1>: Cost 3 vmrghw <4,2,5,3>, LHS
+  2240200806U, // <4,0,2,1>: Cost 3 vmrghw <4,2,5,3>, LHS
   3771663992U, // <4,0,2,2>: Cost 4 vsldoi8 <2,2,4,0>, <2,2,4,0>
-  3772327625U, // <4,0,2,3>: Cost 3 vsldoi8 <2,3,4,0>, <2,3,4,0>
+  2698585801U, // <4,0,2,3>: Cost 3 vsldoi8 <2,3,4,0>, <2,3,4,0>
   3373672105U, // <4,0,2,4>: Cost 4 vmrglw <3,0,4,2>, <2,3,0,4>
   3810813795U, // <4,0,2,5>: Cost 4 vsldoi8 <u,7,4,0>, <2,5,3,1>
   3772327866U, // <4,0,2,6>: Cost 4 vsldoi8 <2,3,4,0>, <2,6,3,7>
   3386280568U, // <4,0,2,7>: Cost 5 vmrglw <5,1,4,2>, <3,6,0,7>
-  3775645790U, // <4,0,2,u>: Cost 3 vsldoi8 <2,u,4,0>, <2,u,4,0>
+  2701903966U, // <4,0,2,u>: Cost 3 vsldoi8 <2,u,4,0>, <2,u,4,0>
   3699638374U, // <4,0,3,0>: Cost 4 vsldoi4 <1,4,0,3>, LHS
-  3827302656U, // <4,0,3,1>: Cost 3 vsldoi12 <0,3,1,4>, <0,3,1,4>
+  2753560832U, // <4,0,3,1>: Cost 3 vsldoi12 <0,3,1,4>, <0,3,1,4>
   3772328276U, // <4,0,3,2>: Cost 4 vsldoi8 <2,3,4,0>, <3,2,4,3>
   3827302674U, // <4,0,3,3>: Cost 4 vsldoi12 <0,3,1,4>, <0,3,3,4>
   3699641654U, // <4,0,3,4>: Cost 4 vsldoi4 <1,4,0,3>, RHS
   3779627588U, // <4,0,3,5>: Cost 4 vsldoi8 <3,5,4,0>, <3,5,4,0>
   3772328604U, // <4,0,3,6>: Cost 4 vsldoi8 <2,3,4,0>, <3,6,4,7>
   3780954854U, // <4,0,3,7>: Cost 4 vsldoi8 <3,7,4,0>, <3,7,4,0>
-  3827302656U, // <4,0,3,u>: Cost 3 vsldoi12 <0,3,1,4>, <0,3,1,4>
-  3798870930U, // <4,0,4,0>: Cost 3 vsldoi8 <6,7,4,0>, <4,0,5,1>
-  2241462374U, // <4,0,4,1>: Cost 2 vmrghw <4,4,4,4>, LHS
+  2753560832U, // <4,0,3,u>: Cost 3 vsldoi12 <0,3,1,4>, <0,3,1,4>
+  2725129106U, // <4,0,4,0>: Cost 3 vsldoi8 <6,7,4,0>, <4,0,5,1>
+  1167720550U, // <4,0,4,1>: Cost 2 vmrghw <4,4,4,4>, LHS
   3839172953U, // <4,0,4,2>: Cost 4 vsldoi12 <2,3,0,4>, <0,4,2,3>
   3772329051U, // <4,0,4,3>: Cost 4 vsldoi8 <2,3,4,0>, <4,3,0,4>
-  3315204434U, // <4,0,4,4>: Cost 3 vmrghw <4,4,4,4>, <0,4,1,5>
-  3772329270U, // <4,0,4,5>: Cost 3 vsldoi8 <2,3,4,0>, RHS
+  2241462610U, // <4,0,4,4>: Cost 3 vmrghw <4,4,4,4>, <0,4,1,5>
+  2698587446U, // <4,0,4,5>: Cost 3 vsldoi8 <2,3,4,0>, RHS
   3772329297U, // <4,0,4,6>: Cost 4 vsldoi8 <2,3,4,0>, <4,6,0,7>
   3735483703U, // <4,0,4,7>: Cost 4 vsldoi4 <7,4,0,4>, <7,4,0,4>
-  2241462941U, // <4,0,4,u>: Cost 2 vmrghw <4,4,4,4>, LHS
-  2242297856U, // <4,0,5,0>: Cost 2 vmrghw RHS, <0,0,0,0>
-  1168556134U, // <4,0,5,1>: Cost 1 vmrghw RHS, LHS
-  3316039853U, // <4,0,5,2>: Cost 3 vmrghw RHS, <0,2,1,2>
-  3711601108U, // <4,0,5,3>: Cost 3 vsldoi4 <3,4,0,5>, <3,4,0,5>
-  2242298194U, // <4,0,5,4>: Cost 2 vmrghw RHS, <0,4,1,5>
-  3316048354U, // <4,0,5,5>: Cost 3 vmrghw RHS, <0,5,u,5>
-  3316040182U, // <4,0,5,6>: Cost 3 vmrghw RHS, <0,6,1,7>
-  3735491896U, // <4,0,5,7>: Cost 3 vsldoi4 <7,4,0,5>, <7,4,0,5>
-  1168556701U, // <4,0,5,u>: Cost 1 vmrghw RHS, LHS
+  1167721117U, // <4,0,4,u>: Cost 2 vmrghw <4,4,4,4>, LHS
+  1168556032U, // <4,0,5,0>: Cost 2 vmrghw RHS, <0,0,0,0>
+  94814310U,   // <4,0,5,1>: Cost 1 vmrghw RHS, LHS
+  2242298029U, // <4,0,5,2>: Cost 3 vmrghw RHS, <0,2,1,2>
+  2637859284U, // <4,0,5,3>: Cost 3 vsldoi4 <3,4,0,5>, <3,4,0,5>
+  1168556370U, // <4,0,5,4>: Cost 2 vmrghw RHS, <0,4,1,5>
+  2242306530U, // <4,0,5,5>: Cost 3 vmrghw RHS, <0,5,u,5>
+  2242298358U, // <4,0,5,6>: Cost 3 vmrghw RHS, <0,6,1,7>
+  2661750072U, // <4,0,5,7>: Cost 3 vsldoi4 <7,4,0,5>, <7,4,0,5>
+  94814877U,   // <4,0,5,u>: Cost 1 vmrghw RHS, LHS
   3316580362U, // <4,0,6,0>: Cost 4 vmrghw <4,6,5,1>, <0,0,1,1>
-  3316588646U, // <4,0,6,1>: Cost 3 vmrghw <4,6,5,2>, LHS
+  2242846822U, // <4,0,6,1>: Cost 3 vmrghw <4,6,5,2>, LHS
   3798872570U, // <4,0,6,2>: Cost 4 vsldoi8 <6,7,4,0>, <6,2,7,3>
   3796218413U, // <4,0,6,3>: Cost 4 vsldoi8 <6,3,4,0>, <6,3,4,0>
   3834528273U, // <4,0,6,4>: Cost 4 vsldoi12 <1,5,0,4>, <0,6,4,7>
   3798872811U, // <4,0,6,5>: Cost 4 vsldoi8 <6,7,4,0>, <6,5,7,1>
   3316621876U, // <4,0,6,6>: Cost 4 vmrghw <4,6,5,6>, <0,6,u,6>
-  3798872945U, // <4,0,6,7>: Cost 3 vsldoi8 <6,7,4,0>, <6,7,4,0>
-  3316589213U, // <4,0,6,u>: Cost 3 vmrghw <4,6,5,2>, LHS
+  2725131121U, // <4,0,6,7>: Cost 3 vsldoi8 <6,7,4,0>, <6,7,4,0>
+  2242847389U, // <4,0,6,u>: Cost 3 vmrghw <4,6,5,2>, LHS
   3377692672U, // <4,0,7,0>: Cost 4 vmrglw <3,6,4,7>, <0,0,0,0>
-  3317235814U, // <4,0,7,1>: Cost 3 vmrghw <4,7,5,0>, LHS
+  2243493990U, // <4,0,7,1>: Cost 3 vmrghw <4,7,5,0>, LHS
   3775648970U, // <4,0,7,2>: Cost 5 vsldoi8 <2,u,4,0>, <7,2,6,3>
   3802191110U, // <4,0,7,3>: Cost 4 vsldoi8 <7,3,4,0>, <7,3,4,0>
   3317236050U, // <4,0,7,4>: Cost 4 vmrghw <4,7,5,0>, <0,4,1,5>
   3803518376U, // <4,0,7,5>: Cost 4 vsldoi8 <7,5,4,0>, <7,5,4,0>
   3317236214U, // <4,0,7,6>: Cost 5 vmrghw <4,7,5,0>, <0,6,1,7>
   3798873708U, // <4,0,7,7>: Cost 4 vsldoi8 <6,7,4,0>, <7,7,7,7>
-  3317236381U, // <4,0,7,u>: Cost 3 vmrghw <4,7,5,0>, LHS
-  2244288512U, // <4,0,u,0>: Cost 2 vmrghw RHS, <0,0,0,0>
-  1170546790U, // <4,0,u,1>: Cost 1 vmrghw RHS, LHS
-  2759017117U, // <4,0,u,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
-  3711625687U, // <4,0,u,3>: Cost 3 vsldoi4 <3,4,0,u>, <3,4,0,u>
-  2244288850U, // <4,0,u,4>: Cost 2 vmrghw RHS, <0,4,1,5>
-  3772332186U, // <4,0,u,5>: Cost 3 vsldoi8 <2,3,4,0>, RHS
-  3318030838U, // <4,0,u,6>: Cost 3 vmrghw RHS, <0,6,1,7>
-  3735516475U, // <4,0,u,7>: Cost 3 vsldoi4 <7,4,0,u>, <7,4,0,u>
-  1170547357U, // <4,0,u,u>: Cost 1 vmrghw RHS, LHS
-  3741491302U, // <4,1,0,0>: Cost 3 vsldoi4 <u,4,1,0>, LHS
-  3763708006U, // <4,1,0,1>: Cost 3 vsldoi8 <0,u,4,1>, LHS
-  3312313242U, // <4,1,0,2>: Cost 3 vmrghw <4,0,1,2>, <1,2,3,4>
+  2243494557U, // <4,0,7,u>: Cost 3 vmrghw <4,7,5,0>, LHS
+  1170546688U, // <4,0,u,0>: Cost 2 vmrghw RHS, <0,0,0,0>
+  96804966U,   // <4,0,u,1>: Cost 1 vmrghw RHS, LHS
+  1685275293U, // <4,0,u,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  2637883863U, // <4,0,u,3>: Cost 3 vsldoi4 <3,4,0,u>, <3,4,0,u>
+  1170547026U, // <4,0,u,4>: Cost 2 vmrghw RHS, <0,4,1,5>
+  2698590362U, // <4,0,u,5>: Cost 3 vsldoi8 <2,3,4,0>, RHS
+  2244289014U, // <4,0,u,6>: Cost 3 vmrghw RHS, <0,6,1,7>
+  2661774651U, // <4,0,u,7>: Cost 3 vsldoi4 <7,4,0,u>, <7,4,0,u>
+  96805533U,   // <4,0,u,u>: Cost 1 vmrghw RHS, LHS
+  2667749478U, // <4,1,0,0>: Cost 3 vsldoi4 <u,4,1,0>, LHS
+  2689966182U, // <4,1,0,1>: Cost 3 vsldoi8 <0,u,4,1>, LHS
+  2238571418U, // <4,1,0,2>: Cost 3 vmrghw <4,0,1,2>, <1,2,3,4>
   3711633880U, // <4,1,0,3>: Cost 4 vsldoi4 <3,4,1,0>, <3,4,1,0>
-  3763708242U, // <4,1,0,4>: Cost 3 vsldoi8 <0,u,4,1>, <0,4,1,5>
+  2689966418U, // <4,1,0,4>: Cost 3 vsldoi8 <0,u,4,1>, <0,4,1,5>
   3361046866U, // <4,1,0,5>: Cost 4 vmrglw <0,u,4,0>, <0,4,1,5>
   3741495802U, // <4,1,0,6>: Cost 4 vsldoi4 <u,4,1,0>, <6,2,7,3>
   3741496314U, // <4,1,0,7>: Cost 4 vsldoi4 <u,4,1,0>, <7,0,1,2>
-  3763708589U, // <4,1,0,u>: Cost 3 vsldoi8 <0,u,4,1>, <0,u,4,1>
+  2689966765U, // <4,1,0,u>: Cost 3 vsldoi8 <0,u,4,1>, <0,u,4,1>
   3764372222U, // <4,1,1,0>: Cost 4 vsldoi8 <1,0,4,1>, <1,0,4,1>
-  3831948087U, // <4,1,1,1>: Cost 3 vsldoi12 <1,1,1,4>, <1,1,1,4>
-  3772335002U, // <4,1,1,2>: Cost 3 vsldoi8 <2,3,4,1>, <1,2,3,4>
+  2758206263U, // <4,1,1,1>: Cost 3 vsldoi12 <1,1,1,4>, <1,1,1,4>
+  2698593178U, // <4,1,1,2>: Cost 3 vsldoi8 <2,3,4,1>, <1,2,3,4>
   3361057810U, // <4,1,1,3>: Cost 4 vmrglw <0,u,4,1>, <4,2,1,3>
   3827303250U, // <4,1,1,4>: Cost 4 vsldoi12 <0,3,1,4>, <1,1,4,4>
-  3361055058U, // <4,1,1,5>: Cost 3 vmrglw <0,u,4,1>, <0,4,1,5>
+  2287313234U, // <4,1,1,5>: Cost 3 vmrglw <0,u,4,1>, <0,4,1,5>
   3763709171U, // <4,1,1,6>: Cost 4 vsldoi8 <0,u,4,1>, <1,6,5,7>
   3361058138U, // <4,1,1,7>: Cost 4 vmrglw <0,u,4,1>, <4,6,1,7>
-  3313501568U, // <4,1,1,u>: Cost 3 vmrghw <4,1,u,3>, <1,u,3,4>
-  3711647846U, // <4,1,2,0>: Cost 3 vsldoi4 <3,4,1,2>, LHS
-  3711648666U, // <4,1,2,1>: Cost 3 vsldoi4 <3,4,1,2>, <1,2,3,4>
+  2239759744U, // <4,1,1,u>: Cost 3 vmrghw <4,1,u,3>, <1,u,3,4>
+  2637906022U, // <4,1,2,0>: Cost 3 vsldoi4 <3,4,1,2>, LHS
+  2637906842U, // <4,1,2,1>: Cost 3 vsldoi4 <3,4,1,2>, <1,2,3,4>
   3763709544U, // <4,1,2,2>: Cost 4 vsldoi8 <0,u,4,1>, <2,2,2,2>
-  2759017370U, // <4,1,2,3>: Cost 2 vsldoi12 <1,2,3,4>, <1,2,3,4>
-  3711651126U, // <4,1,2,4>: Cost 3 vsldoi4 <3,4,1,2>, RHS
+  1685275546U, // <4,1,2,3>: Cost 2 vsldoi12 <1,2,3,4>, <1,2,3,4>
+  2637909302U, // <4,1,2,4>: Cost 3 vsldoi4 <3,4,1,2>, RHS
   3361063250U, // <4,1,2,5>: Cost 4 vmrglw <0,u,4,2>, <0,4,1,5>
   3763709882U, // <4,1,2,6>: Cost 4 vsldoi8 <0,u,4,1>, <2,6,3,7>
   3735541054U, // <4,1,2,7>: Cost 4 vsldoi4 <7,4,1,2>, <7,4,1,2>
-  2759386055U, // <4,1,2,u>: Cost 2 vsldoi12 <1,2,u,4>, <1,2,u,4>
-  3776317616U, // <4,1,3,0>: Cost 3 vsldoi8 <3,0,4,1>, <3,0,4,1>
+  1685644231U, // <4,1,2,u>: Cost 2 vsldoi12 <1,2,u,4>, <1,2,u,4>
+  2702575792U, // <4,1,3,0>: Cost 3 vsldoi8 <3,0,4,1>, <3,0,4,1>
   3832759257U, // <4,1,3,1>: Cost 4 vsldoi12 <1,2,3,4>, <1,3,1,4>
   3833349090U, // <4,1,3,2>: Cost 4 vsldoi12 <1,3,2,4>, <1,3,2,4>
   3763710364U, // <4,1,3,3>: Cost 4 vsldoi8 <0,u,4,1>, <3,3,3,3>
-  3781626370U, // <4,1,3,4>: Cost 3 vsldoi8 <3,u,4,1>, <3,4,5,6>
+  2707884546U, // <4,1,3,4>: Cost 3 vsldoi8 <3,u,4,1>, <3,4,5,6>
   3361071442U, // <4,1,3,5>: Cost 4 vmrglw <0,u,4,3>, <0,4,1,5>
   3772336796U, // <4,1,3,6>: Cost 4 vsldoi8 <2,3,4,1>, <3,6,4,7>
   3775654595U, // <4,1,3,7>: Cost 5 vsldoi8 <2,u,4,1>, <3,7,0,1>
-  3781626680U, // <4,1,3,u>: Cost 3 vsldoi8 <3,u,4,1>, <3,u,4,1>
-  3741524070U, // <4,1,4,0>: Cost 3 vsldoi4 <u,4,1,4>, LHS
-  3315204916U, // <4,1,4,1>: Cost 3 vmrghw <4,4,4,4>, <1,1,1,1>
-  3315295130U, // <4,1,4,2>: Cost 3 vmrghw <4,4,5,6>, <1,2,3,4>
+  2707884856U, // <4,1,3,u>: Cost 3 vsldoi8 <3,u,4,1>, <3,u,4,1>
+  2667782246U, // <4,1,4,0>: Cost 3 vsldoi4 <u,4,1,4>, LHS
+  2241463092U, // <4,1,4,1>: Cost 3 vmrghw <4,4,4,4>, <1,1,1,1>
+  2241553306U, // <4,1,4,2>: Cost 3 vmrghw <4,4,5,6>, <1,2,3,4>
   3827303484U, // <4,1,4,3>: Cost 4 vsldoi12 <0,3,1,4>, <1,4,3,4>
-  3741527248U, // <4,1,4,4>: Cost 3 vsldoi4 <u,4,1,4>, <4,4,4,4>
-  3763711286U, // <4,1,4,5>: Cost 3 vsldoi8 <0,u,4,1>, RHS
+  2667785424U, // <4,1,4,4>: Cost 3 vsldoi4 <u,4,1,4>, <4,4,4,4>
+  2689969462U, // <4,1,4,5>: Cost 3 vsldoi8 <0,u,4,1>, RHS
   3763711322U, // <4,1,4,6>: Cost 4 vsldoi8 <0,u,4,1>, <4,6,1,7>
   3867116636U, // <4,1,4,7>: Cost 4 vsldoi12 <7,0,1,4>, <1,4,7,0>
-  3763711529U, // <4,1,4,u>: Cost 3 vsldoi8 <0,u,4,1>, RHS
-  2620014930U, // <4,1,5,0>: Cost 2 vsldoi4 <0,4,1,5>, <0,4,1,5>
-  2242298676U, // <4,1,5,1>: Cost 2 vmrghw RHS, <1,1,1,1>
-  2242298774U, // <4,1,5,2>: Cost 2 vmrghw RHS, <1,2,3,0>
-  3693758614U, // <4,1,5,3>: Cost 3 vsldoi4 <0,4,1,5>, <3,0,1,2>
-  2620017974U, // <4,1,5,4>: Cost 2 vsldoi4 <0,4,1,5>, RHS
-  3693760516U, // <4,1,5,5>: Cost 3 vsldoi4 <0,4,1,5>, <5,5,5,5>
-  3316040911U, // <4,1,5,6>: Cost 3 vmrghw RHS, <1,6,1,7>
-  3741537274U, // <4,1,5,7>: Cost 3 vsldoi4 <u,4,1,5>, <7,0,1,2>
-  2620020526U, // <4,1,5,u>: Cost 2 vsldoi4 <0,4,1,5>, LHS
+  2689969705U, // <4,1,4,u>: Cost 3 vsldoi8 <0,u,4,1>, RHS
+  1546273106U, // <4,1,5,0>: Cost 2 vsldoi4 <0,4,1,5>, <0,4,1,5>
+  1168556852U, // <4,1,5,1>: Cost 2 vmrghw RHS, <1,1,1,1>
+  1168556950U, // <4,1,5,2>: Cost 2 vmrghw RHS, <1,2,3,0>
+  2620016790U, // <4,1,5,3>: Cost 3 vsldoi4 <0,4,1,5>, <3,0,1,2>
+  1546276150U, // <4,1,5,4>: Cost 2 vsldoi4 <0,4,1,5>, RHS
+  2620018692U, // <4,1,5,5>: Cost 3 vsldoi4 <0,4,1,5>, <5,5,5,5>
+  2242299087U, // <4,1,5,6>: Cost 3 vmrghw RHS, <1,6,1,7>
+  2667795450U, // <4,1,5,7>: Cost 3 vsldoi4 <u,4,1,5>, <7,0,1,2>
+  1546278702U, // <4,1,5,u>: Cost 2 vsldoi4 <0,4,1,5>, LHS
   3781628193U, // <4,1,6,0>: Cost 4 vsldoi8 <3,u,4,1>, <6,0,1,2>
   3832759503U, // <4,1,6,1>: Cost 4 vsldoi12 <1,2,3,4>, <1,6,1,7>
   3316261786U, // <4,1,6,2>: Cost 4 vmrghw <4,6,0,7>, <1,2,3,4>
@@ -3081,357 +3081,357 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3788264248U, // <4,1,6,6>: Cost 4 vsldoi8 <5,0,4,1>, <6,6,6,6>
   3788264270U, // <4,1,6,7>: Cost 4 vsldoi8 <5,0,4,1>, <6,7,0,1>
   3832759566U, // <4,1,6,u>: Cost 4 vsldoi12 <1,2,3,4>, <1,6,u,7>
-  3800208404U, // <4,1,7,0>: Cost 3 vsldoi8 <7,0,4,1>, <7,0,4,1>
+  2726466580U, // <4,1,7,0>: Cost 3 vsldoi8 <7,0,4,1>, <7,0,4,1>
   3377692682U, // <4,1,7,1>: Cost 4 vmrglw <3,6,4,7>, <0,0,1,1>
   3377694870U, // <4,1,7,2>: Cost 4 vmrglw <3,6,4,7>, <3,0,1,2>
   3802199303U, // <4,1,7,3>: Cost 4 vsldoi8 <7,3,4,1>, <7,3,4,1>
-  3805517158U, // <4,1,7,4>: Cost 3 vsldoi8 <7,u,4,1>, <7,4,5,6>
+  2731775334U, // <4,1,7,4>: Cost 3 vsldoi8 <7,u,4,1>, <7,4,5,6>
   3377693010U, // <4,1,7,5>: Cost 4 vmrglw <3,6,4,7>, <0,4,1,5>
   3365749804U, // <4,1,7,6>: Cost 5 vmrglw <1,6,4,7>, <1,4,1,6>
   3788265068U, // <4,1,7,7>: Cost 4 vsldoi8 <5,0,4,1>, <7,7,7,7>
-  3805517468U, // <4,1,7,u>: Cost 3 vsldoi8 <7,u,4,1>, <7,u,4,1>
-  2620039509U, // <4,1,u,0>: Cost 2 vsldoi4 <0,4,1,u>, <0,4,1,u>
-  2244289332U, // <4,1,u,1>: Cost 2 vmrghw RHS, <1,1,1,1>
-  2244289430U, // <4,1,u,2>: Cost 2 vmrghw RHS, <1,2,3,0>
-  2762999168U, // <4,1,u,3>: Cost 2 vsldoi12 <1,u,3,4>, <1,u,3,4>
-  2620042550U, // <4,1,u,4>: Cost 2 vsldoi4 <0,4,1,u>, RHS
-  3358458194U, // <4,1,u,5>: Cost 3 vmrglw <0,4,4,u>, <0,4,1,5>
-  3318031567U, // <4,1,u,6>: Cost 3 vmrghw RHS, <1,6,1,7>
-  3741561850U, // <4,1,u,7>: Cost 3 vsldoi4 <u,4,1,u>, <7,0,1,2>
-  2620045102U, // <4,1,u,u>: Cost 2 vsldoi4 <0,4,1,u>, LHS
+  2731775644U, // <4,1,7,u>: Cost 3 vsldoi8 <7,u,4,1>, <7,u,4,1>
+  1546297685U, // <4,1,u,0>: Cost 2 vsldoi4 <0,4,1,u>, <0,4,1,u>
+  1170547508U, // <4,1,u,1>: Cost 2 vmrghw RHS, <1,1,1,1>
+  1170547606U, // <4,1,u,2>: Cost 2 vmrghw RHS, <1,2,3,0>
+  1689257344U, // <4,1,u,3>: Cost 2 vsldoi12 <1,u,3,4>, <1,u,3,4>
+  1546300726U, // <4,1,u,4>: Cost 2 vsldoi4 <0,4,1,u>, RHS
+  2284716370U, // <4,1,u,5>: Cost 3 vmrglw <0,4,4,u>, <0,4,1,5>
+  2244289743U, // <4,1,u,6>: Cost 3 vmrghw RHS, <1,6,1,7>
+  2667820026U, // <4,1,u,7>: Cost 3 vsldoi4 <u,4,1,u>, <7,0,1,2>
+  1546303278U, // <4,1,u,u>: Cost 2 vsldoi4 <0,4,1,u>, LHS
   3729621094U, // <4,2,0,0>: Cost 4 vsldoi4 <6,4,2,0>, LHS
   3763716198U, // <4,2,0,1>: Cost 4 vsldoi8 <0,u,4,2>, LHS
-  3312600680U, // <4,2,0,2>: Cost 3 vmrghw <4,0,5,1>, <2,2,2,2>
-  3369672806U, // <4,2,0,3>: Cost 3 vmrglw <2,3,4,0>, LHS
+  2238858856U, // <4,2,0,2>: Cost 3 vmrghw <4,0,5,1>, <2,2,2,2>
+  2295930982U, // <4,2,0,3>: Cost 3 vmrglw <2,3,4,0>, LHS
   3763716434U, // <4,2,0,4>: Cost 4 vsldoi8 <0,u,4,2>, <0,4,1,5>
-  3312600931U, // <4,2,0,5>: Cost 3 vmrghw <4,0,5,1>, <2,5,3,1>
-  3312601018U, // <4,2,0,6>: Cost 3 vmrghw <4,0,5,1>, <2,6,3,7>
+  2238859107U, // <4,2,0,5>: Cost 3 vmrghw <4,0,5,1>, <2,5,3,1>
+  2238859194U, // <4,2,0,6>: Cost 3 vmrghw <4,0,5,1>, <2,6,3,7>
   3312601066U, // <4,2,0,7>: Cost 4 vmrghw <4,0,5,1>, <2,7,0,1>
-  3369672811U, // <4,2,0,u>: Cost 3 vmrglw <2,3,4,0>, LHS
+  2295930987U, // <4,2,0,u>: Cost 3 vmrglw <2,3,4,0>, LHS
   3699769446U, // <4,2,1,0>: Cost 4 vsldoi4 <1,4,2,1>, LHS
   3313255971U, // <4,2,1,1>: Cost 4 vmrghw <4,1,5,0>, <2,1,3,5>
   3361056360U, // <4,2,1,2>: Cost 4 vmrglw <0,u,4,1>, <2,2,2,2>
-  3361054822U, // <4,2,1,3>: Cost 3 vmrglw <0,u,4,1>, LHS
+  2287312998U, // <4,2,1,3>: Cost 3 vmrglw <0,u,4,1>, LHS
   3788932148U, // <4,2,1,4>: Cost 4 vsldoi8 <5,1,4,2>, <1,4,2,5>
   3313256290U, // <4,2,1,5>: Cost 4 vmrghw <4,1,5,0>, <2,5,3,0>
   3838289469U, // <4,2,1,6>: Cost 4 vsldoi12 <2,1,6,4>, <2,1,6,4>
   3369682865U, // <4,2,1,7>: Cost 5 vmrglw <2,3,4,1>, <2,6,2,7>
-  3361054827U, // <4,2,1,u>: Cost 3 vmrglw <0,u,4,1>, LHS
+  2287313003U, // <4,2,1,u>: Cost 3 vmrglw <0,u,4,1>, LHS
   3838658133U, // <4,2,2,0>: Cost 4 vsldoi12 <2,2,2,4>, <2,2,0,1>
   3711722394U, // <4,2,2,1>: Cost 4 vsldoi4 <3,4,2,2>, <1,2,3,4>
-  3832759912U, // <4,2,2,2>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,2,2>
-  3832759922U, // <4,2,2,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,3,3>
+  2759018088U, // <4,2,2,2>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,2,2>
+  2759018098U, // <4,2,2,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,3,3>
   3838658168U, // <4,2,2,4>: Cost 4 vsldoi12 <2,2,2,4>, <2,2,4,0>
   3369027341U, // <4,2,2,5>: Cost 4 vmrglw <2,2,4,2>, <2,4,2,5>
-  3313969082U, // <4,2,2,6>: Cost 3 vmrghw <4,2,5,6>, <2,6,3,7>
+  2240227258U, // <4,2,2,6>: Cost 3 vmrghw <4,2,5,6>, <2,6,3,7>
   3735614791U, // <4,2,2,7>: Cost 4 vsldoi4 <7,4,2,2>, <7,4,2,2>
-  3832759967U, // <4,2,2,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,u,3>
-  3832759974U, // <4,2,3,0>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,0,1>
+  2759018143U, // <4,2,2,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,2,u,3>
+  2759018150U, // <4,2,3,0>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,0,1>
   3831948975U, // <4,2,3,1>: Cost 4 vsldoi12 <1,1,1,4>, <2,3,1,1>
   3832759993U, // <4,2,3,2>: Cost 4 vsldoi12 <1,2,3,4>, <2,3,2,2>
-  3832760004U, // <4,2,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,3,4>
-  3832760009U, // <4,2,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,4,0>
+  2759018180U, // <4,2,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,3,4>
+  2759018185U, // <4,2,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,4,0>
   3839542998U, // <4,2,3,5>: Cost 4 vsldoi12 <2,3,5,4>, <2,3,5,4>
   3314640826U, // <4,2,3,6>: Cost 4 vmrghw <4,3,5,7>, <2,6,3,7>
-  3839690472U, // <4,2,3,7>: Cost 3 vsldoi12 <2,3,7,4>, <2,3,7,4>
-  3832760046U, // <4,2,3,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,u,1>
+  2765948648U, // <4,2,3,7>: Cost 3 vsldoi12 <2,3,7,4>, <2,3,7,4>
+  2759018222U, // <4,2,3,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,3,u,1>
   3838658295U, // <4,2,4,0>: Cost 4 vsldoi12 <2,2,2,4>, <2,4,0,1>
   3315205667U, // <4,2,4,1>: Cost 4 vmrghw <4,4,4,4>, <2,1,3,5>
-  3315205736U, // <4,2,4,2>: Cost 3 vmrghw <4,4,4,4>, <2,2,2,2>
-  2308571238U, // <4,2,4,3>: Cost 2 vmrglw <4,4,4,4>, LHS
-  3315205909U, // <4,2,4,4>: Cost 3 vmrghw <4,4,4,4>, <2,4,3,4>
-  3315287911U, // <4,2,4,5>: Cost 3 vmrghw <4,4,5,5>, <2,5,3,5>
-  3315206074U, // <4,2,4,6>: Cost 3 vmrghw <4,4,4,4>, <2,6,3,7>
+  2241463912U, // <4,2,4,2>: Cost 3 vmrghw <4,4,4,4>, <2,2,2,2>
+  1234829414U, // <4,2,4,3>: Cost 2 vmrglw <4,4,4,4>, LHS
+  2241464085U, // <4,2,4,4>: Cost 3 vmrghw <4,4,4,4>, <2,4,3,4>
+  2241546087U, // <4,2,4,5>: Cost 3 vmrghw <4,4,5,5>, <2,5,3,5>
+  2241464250U, // <4,2,4,6>: Cost 3 vmrghw <4,4,4,4>, <2,6,3,7>
   3741602873U, // <4,2,4,7>: Cost 4 vsldoi4 <u,4,2,4>, <7,0,u,2>
-  2308571243U, // <4,2,4,u>: Cost 2 vmrglw <4,4,4,4>, LHS
-  3699802214U, // <4,2,5,0>: Cost 3 vsldoi4 <1,4,2,5>, LHS
-  3699803188U, // <4,2,5,1>: Cost 3 vsldoi4 <1,4,2,5>, <1,4,2,5>
-  2242299496U, // <4,2,5,2>: Cost 2 vmrghw RHS, <2,2,2,2>
-  2295971942U, // <4,2,5,3>: Cost 2 vmrglw <2,3,4,5>, LHS
-  3699805494U, // <4,2,5,4>: Cost 3 vsldoi4 <1,4,2,5>, RHS
-  3316041576U, // <4,2,5,5>: Cost 3 vmrghw RHS, <2,5,3,6>
-  2242299834U, // <4,2,5,6>: Cost 2 vmrghw RHS, <2,6,3,7>
-  3316041706U, // <4,2,5,7>: Cost 3 vmrghw RHS, <2,7,0,1>
-  2295971947U, // <4,2,5,u>: Cost 2 vmrglw <2,3,4,5>, LHS
+  1234829419U, // <4,2,4,u>: Cost 2 vmrglw <4,4,4,4>, LHS
+  2626060390U, // <4,2,5,0>: Cost 3 vsldoi4 <1,4,2,5>, LHS
+  2626061364U, // <4,2,5,1>: Cost 3 vsldoi4 <1,4,2,5>, <1,4,2,5>
+  1168557672U, // <4,2,5,2>: Cost 2 vmrghw RHS, <2,2,2,2>
+  1222230118U, // <4,2,5,3>: Cost 2 vmrglw <2,3,4,5>, LHS
+  2626063670U, // <4,2,5,4>: Cost 3 vsldoi4 <1,4,2,5>, RHS
+  2242299752U, // <4,2,5,5>: Cost 3 vmrghw RHS, <2,5,3,6>
+  1168558010U, // <4,2,5,6>: Cost 2 vmrghw RHS, <2,6,3,7>
+  2242299882U, // <4,2,5,7>: Cost 3 vmrghw RHS, <2,7,0,1>
+  1222230123U, // <4,2,5,u>: Cost 2 vmrglw <2,3,4,5>, LHS
   3711754342U, // <4,2,6,0>: Cost 4 vsldoi4 <3,4,2,6>, LHS
   3711755162U, // <4,2,6,1>: Cost 4 vsldoi4 <3,4,2,6>, <1,2,3,4>
   3838658481U, // <4,2,6,2>: Cost 4 vsldoi12 <2,2,2,4>, <2,6,2,7>
-  3832760250U, // <4,2,6,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,6,3,7>
+  2759018426U, // <4,2,6,3>: Cost 3 vsldoi12 <1,2,3,4>, <2,6,3,7>
   3838658499U, // <4,2,6,4>: Cost 4 vsldoi12 <2,2,2,4>, <2,6,4,7>
   3735646310U, // <4,2,6,5>: Cost 4 vsldoi4 <7,4,2,6>, <5,6,7,4>
   3316590522U, // <4,2,6,6>: Cost 4 vmrghw <4,6,5,2>, <2,6,3,7>
   3798889331U, // <4,2,6,7>: Cost 4 vsldoi8 <6,7,4,2>, <6,7,4,2>
-  3832760295U, // <4,2,6,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,6,u,7>
+  2759018471U, // <4,2,6,u>: Cost 3 vsldoi12 <1,2,3,4>, <2,6,u,7>
   3874564074U, // <4,2,7,0>: Cost 4 vsldoi12 <u,2,3,4>, <2,7,0,1>
   3800880230U, // <4,2,7,1>: Cost 4 vsldoi8 <7,1,4,2>, <7,1,4,2>
   3371722344U, // <4,2,7,2>: Cost 4 vmrglw <2,6,4,7>, <2,2,2,2>
-  3377692774U, // <4,2,7,3>: Cost 3 vmrglw <3,6,4,7>, LHS
+  2303950950U, // <4,2,7,3>: Cost 3 vmrglw <3,6,4,7>, LHS
   3371722346U, // <4,2,7,4>: Cost 4 vmrglw <2,6,4,7>, <2,2,2,4>
   3371722509U, // <4,2,7,5>: Cost 5 vmrglw <2,6,4,7>, <2,4,2,5>
   3317237690U, // <4,2,7,6>: Cost 4 vmrghw <4,7,5,0>, <2,6,3,7>
   3317237738U, // <4,2,7,7>: Cost 4 vmrghw <4,7,5,0>, <2,7,0,1>
-  3377692779U, // <4,2,7,u>: Cost 3 vmrglw <3,6,4,7>, LHS
-  3832760379U, // <4,2,u,0>: Cost 3 vsldoi12 <1,2,3,4>, <2,u,0,1>
-  3699827767U, // <4,2,u,1>: Cost 3 vsldoi4 <1,4,2,u>, <1,4,2,u>
-  2244290152U, // <4,2,u,2>: Cost 2 vmrghw RHS, <2,2,2,2>
-  2295996518U, // <4,2,u,3>: Cost 2 vmrglw <2,3,4,u>, LHS
-  3832760419U, // <4,2,u,4>: Cost 3 vsldoi12 <1,2,3,4>, <2,u,4,5>
-  3318032232U, // <4,2,u,5>: Cost 3 vmrghw RHS, <2,5,3,6>
-  2244290490U, // <4,2,u,6>: Cost 2 vmrghw RHS, <2,6,3,7>
-  3843008637U, // <4,2,u,7>: Cost 3 vsldoi12 <2,u,7,4>, <2,u,7,4>
-  2295996523U, // <4,2,u,u>: Cost 2 vmrglw <2,3,4,u>, LHS
-  3312601238U, // <4,3,0,0>: Cost 3 vmrghw <4,0,5,1>, <3,0,1,2>
-  3832760470U, // <4,3,0,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,0,1,2>
+  2303950955U, // <4,2,7,u>: Cost 3 vmrglw <3,6,4,7>, LHS
+  2759018555U, // <4,2,u,0>: Cost 3 vsldoi12 <1,2,3,4>, <2,u,0,1>
+  2626085943U, // <4,2,u,1>: Cost 3 vsldoi4 <1,4,2,u>, <1,4,2,u>
+  1170548328U, // <4,2,u,2>: Cost 2 vmrghw RHS, <2,2,2,2>
+  1222254694U, // <4,2,u,3>: Cost 2 vmrglw <2,3,4,u>, LHS
+  2759018595U, // <4,2,u,4>: Cost 3 vsldoi12 <1,2,3,4>, <2,u,4,5>
+  2244290408U, // <4,2,u,5>: Cost 3 vmrghw RHS, <2,5,3,6>
+  1170548666U, // <4,2,u,6>: Cost 2 vmrghw RHS, <2,6,3,7>
+  2769266813U, // <4,2,u,7>: Cost 3 vsldoi12 <2,u,7,4>, <2,u,7,4>
+  1222254699U, // <4,2,u,u>: Cost 2 vmrglw <2,3,4,u>, LHS
+  2238859414U, // <4,3,0,0>: Cost 3 vmrghw <4,0,5,1>, <3,0,1,2>
+  2759018646U, // <4,3,0,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,0,1,2>
   3312314708U, // <4,3,0,2>: Cost 4 vmrghw <4,0,1,2>, <3,2,4,3>
-  3312601500U, // <4,3,0,3>: Cost 3 vmrghw <4,0,5,1>, <3,3,3,3>
-  3369673626U, // <4,3,0,4>: Cost 3 vmrglw <2,3,4,0>, <1,2,3,4>
+  2238859676U, // <4,3,0,3>: Cost 3 vmrghw <4,0,5,1>, <3,3,3,3>
+  2295931802U, // <4,3,0,4>: Cost 3 vmrglw <2,3,4,0>, <1,2,3,4>
   3735670886U, // <4,3,0,5>: Cost 4 vsldoi4 <7,4,3,0>, <5,6,7,4>
   3312315036U, // <4,3,0,6>: Cost 4 vmrghw <4,0,1,2>, <3,6,4,7>
   3369674682U, // <4,3,0,7>: Cost 4 vmrglw <2,3,4,0>, <2,6,3,7>
-  3832760533U, // <4,3,0,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,0,u,2>
+  2759018709U, // <4,3,0,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,0,u,2>
   3361055638U, // <4,3,1,0>: Cost 4 vmrglw <0,u,4,1>, <1,2,3,0>
   3831949542U, // <4,3,1,1>: Cost 4 vsldoi12 <1,1,1,4>, <3,1,1,1>
-  3777659802U, // <4,3,1,2>: Cost 3 vsldoi8 <3,2,4,3>, <1,2,3,4>
+  2703917978U, // <4,3,1,2>: Cost 3 vsldoi8 <3,2,4,3>, <1,2,3,4>
   3361056370U, // <4,3,1,3>: Cost 4 vmrglw <0,u,4,1>, <2,2,3,3>
-  3369681818U, // <4,3,1,4>: Cost 3 vmrglw <2,3,4,1>, <1,2,3,4>
+  2295939994U, // <4,3,1,4>: Cost 3 vmrglw <2,3,4,1>, <1,2,3,4>
   3361056291U, // <4,3,1,5>: Cost 4 vmrglw <0,u,4,1>, <2,1,3,5>
   3378972520U, // <4,3,1,6>: Cost 4 vmrglw <3,u,4,1>, <2,5,3,6>
   3361056698U, // <4,3,1,7>: Cost 4 vmrglw <0,u,4,1>, <2,6,3,7>
-  3777659802U, // <4,3,1,u>: Cost 3 vsldoi8 <3,2,4,3>, <1,2,3,4>
+  2703917978U, // <4,3,1,u>: Cost 3 vsldoi8 <3,2,4,3>, <1,2,3,4>
   3832760624U, // <4,3,2,0>: Cost 4 vsldoi12 <1,2,3,4>, <3,2,0,3>
   3711796122U, // <4,3,2,1>: Cost 4 vsldoi4 <3,4,3,2>, <1,2,3,4>
   3832760641U, // <4,3,2,2>: Cost 4 vsldoi12 <1,2,3,4>, <3,2,2,2>
-  3844704588U, // <4,3,2,3>: Cost 3 vsldoi12 <3,2,3,4>, <3,2,3,4>
-  3832760660U, // <4,3,2,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,2,4,3>
+  2770962764U, // <4,3,2,3>: Cost 3 vsldoi12 <3,2,3,4>, <3,2,3,4>
+  2759018836U, // <4,3,2,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,2,4,3>
   3827304802U, // <4,3,2,5>: Cost 5 vsldoi12 <0,3,1,4>, <3,2,5,u>
   3832760678U, // <4,3,2,6>: Cost 4 vsldoi12 <1,2,3,4>, <3,2,6,3>
   3859597679U, // <4,3,2,7>: Cost 4 vsldoi12 <5,6,7,4>, <3,2,7,3>
-  3845073273U, // <4,3,2,u>: Cost 3 vsldoi12 <3,2,u,4>, <3,2,u,4>
-  3314583702U, // <4,3,3,0>: Cost 3 vmrghw <4,3,5,0>, <3,0,1,2>
+  2771331449U, // <4,3,2,u>: Cost 3 vsldoi12 <3,2,u,4>, <3,2,u,4>
+  2240841878U, // <4,3,3,0>: Cost 3 vmrghw <4,3,5,0>, <3,0,1,2>
   3776997635U, // <4,3,3,1>: Cost 4 vsldoi8 <3,1,4,3>, <3,1,4,3>
-  3777661268U, // <4,3,3,2>: Cost 3 vsldoi8 <3,2,4,3>, <3,2,4,3>
-  3832760732U, // <4,3,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <3,3,3,3>
-  3832760742U, // <4,3,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,3,4,4>
+  2703919444U, // <4,3,3,2>: Cost 3 vsldoi8 <3,2,4,3>, <3,2,4,3>
+  2759018908U, // <4,3,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <3,3,3,3>
+  2759018918U, // <4,3,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,3,4,4>
   3386951446U, // <4,3,3,5>: Cost 4 vmrglw <5,2,4,3>, <2,4,3,5>
   3777661596U, // <4,3,3,6>: Cost 4 vsldoi8 <3,2,4,3>, <3,6,4,7>
   3375007674U, // <4,3,3,7>: Cost 4 vmrglw <3,2,4,3>, <2,6,3,7>
-  3781643066U, // <4,3,3,u>: Cost 3 vsldoi8 <3,u,4,3>, <3,u,4,3>
-  3832760784U, // <4,3,4,0>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,0,1>
-  3832760794U, // <4,3,4,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,1,2>
-  3705841429U, // <4,3,4,2>: Cost 3 vsldoi4 <2,4,3,4>, <2,4,3,4>
-  3315206556U, // <4,3,4,3>: Cost 3 vmrghw <4,4,4,4>, <3,3,3,3>
-  3832760824U, // <4,3,4,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,4,5>
-  3827304962U, // <4,3,4,5>: Cost 3 vsldoi12 <0,3,1,4>, <3,4,5,6>
+  2707901242U, // <4,3,3,u>: Cost 3 vsldoi8 <3,u,4,3>, <3,u,4,3>
+  2759018960U, // <4,3,4,0>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,0,1>
+  2759018970U, // <4,3,4,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,1,2>
+  2632099605U, // <4,3,4,2>: Cost 3 vsldoi4 <2,4,3,4>, <2,4,3,4>
+  2241464732U, // <4,3,4,3>: Cost 3 vmrghw <4,4,4,4>, <3,3,3,3>
+  2759019000U, // <4,3,4,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,4,5>
+  2753563138U, // <4,3,4,5>: Cost 3 vsldoi12 <0,3,1,4>, <3,4,5,6>
   3777662316U, // <4,3,4,6>: Cost 4 vsldoi8 <3,2,4,3>, <4,6,3,7>
-  3382314938U, // <4,3,4,7>: Cost 3 vmrglw <4,4,4,4>, <2,6,3,7>
-  3832760856U, // <4,3,4,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,u,1>
-  2242300054U, // <4,3,5,0>: Cost 2 vmrghw RHS, <3,0,1,2>
-  3316041958U, // <4,3,5,1>: Cost 3 vmrghw RHS, <3,1,1,1>
-  3705849622U, // <4,3,5,2>: Cost 3 vsldoi4 <2,4,3,5>, <2,4,3,5>
-  2242300316U, // <4,3,5,3>: Cost 2 vmrghw RHS, <3,3,3,3>
-  2242300418U, // <4,3,5,4>: Cost 2 vmrghw RHS, <3,4,5,6>
-  3369715478U, // <4,3,5,5>: Cost 3 vmrglw <2,3,4,5>, <2,4,3,5>
-  3316042360U, // <4,3,5,6>: Cost 3 vmrghw RHS, <3,6,0,7>
-  3369715642U, // <4,3,5,7>: Cost 3 vmrglw <2,3,4,5>, <2,6,3,7>
-  2242300702U, // <4,3,5,u>: Cost 2 vmrghw RHS, <3,u,1,2>
+  2308573114U, // <4,3,4,7>: Cost 3 vmrglw <4,4,4,4>, <2,6,3,7>
+  2759019032U, // <4,3,4,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,4,u,1>
+  1168558230U, // <4,3,5,0>: Cost 2 vmrghw RHS, <3,0,1,2>
+  2242300134U, // <4,3,5,1>: Cost 3 vmrghw RHS, <3,1,1,1>
+  2632107798U, // <4,3,5,2>: Cost 3 vsldoi4 <2,4,3,5>, <2,4,3,5>
+  1168558492U, // <4,3,5,3>: Cost 2 vmrghw RHS, <3,3,3,3>
+  1168558594U, // <4,3,5,4>: Cost 2 vmrghw RHS, <3,4,5,6>
+  2295973654U, // <4,3,5,5>: Cost 3 vmrglw <2,3,4,5>, <2,4,3,5>
+  2242300536U, // <4,3,5,6>: Cost 3 vmrghw RHS, <3,6,0,7>
+  2295973818U, // <4,3,5,7>: Cost 3 vmrglw <2,3,4,5>, <2,6,3,7>
+  1168558878U, // <4,3,5,u>: Cost 2 vmrghw RHS, <3,u,1,2>
   3832760952U, // <4,3,6,0>: Cost 4 vsldoi12 <1,2,3,4>, <3,6,0,7>
   3711828890U, // <4,3,6,1>: Cost 4 vsldoi4 <3,4,3,6>, <1,2,3,4>
   3316484436U, // <4,3,6,2>: Cost 4 vmrghw <4,6,3,7>, <3,2,4,3>
   3711830512U, // <4,3,6,3>: Cost 4 vsldoi4 <3,4,3,6>, <3,4,3,6>
-  3832760988U, // <4,3,6,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,6,4,7>
+  2759019164U, // <4,3,6,4>: Cost 3 vsldoi12 <1,2,3,4>, <3,6,4,7>
   3361097251U, // <4,3,6,5>: Cost 5 vmrglw <0,u,4,6>, <2,1,3,5>
   3316624045U, // <4,3,6,6>: Cost 4 vmrghw <4,6,5,6>, <3,6,6,6>
-  3847654068U, // <4,3,6,7>: Cost 3 vsldoi12 <3,6,7,4>, <3,6,7,4>
-  3832760988U, // <4,3,6,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,6,4,7>
+  2773912244U, // <4,3,6,7>: Cost 3 vsldoi12 <3,6,7,4>, <3,6,7,4>
+  2759019164U, // <4,3,6,u>: Cost 3 vsldoi12 <1,2,3,4>, <3,6,4,7>
   3377693590U, // <4,3,7,0>: Cost 4 vmrglw <3,6,4,7>, <1,2,3,0>
   3365751680U, // <4,3,7,1>: Cost 5 vmrglw <1,6,4,7>, <4,0,3,1>
-  3801552056U, // <4,3,7,2>: Cost 3 vsldoi8 <7,2,4,3>, <7,2,4,3>
+  2727810232U, // <4,3,7,2>: Cost 3 vsldoi8 <7,2,4,3>, <7,2,4,3>
   3377694322U, // <4,3,7,3>: Cost 4 vmrglw <3,6,4,7>, <2,2,3,3>
-  3377693594U, // <4,3,7,4>: Cost 3 vmrglw <3,6,4,7>, <1,2,3,4>
+  2303951770U, // <4,3,7,4>: Cost 3 vmrglw <3,6,4,7>, <1,2,3,4>
   3741700198U, // <4,3,7,5>: Cost 4 vsldoi4 <u,4,3,7>, <5,6,7,4>
   3377695216U, // <4,3,7,6>: Cost 4 vmrglw <3,6,4,7>, <3,4,3,6>
   3375703994U, // <4,3,7,7>: Cost 4 vmrglw <3,3,4,7>, <2,6,3,7>
-  3805533854U, // <4,3,7,u>: Cost 3 vsldoi8 <7,u,4,3>, <7,u,4,3>
-  2244290710U, // <4,3,u,0>: Cost 2 vmrghw RHS, <3,0,1,2>
-  3832761118U, // <4,3,u,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,u,1,2>
-  3705874201U, // <4,3,u,2>: Cost 3 vsldoi4 <2,4,3,u>, <2,4,3,u>
-  2244290972U, // <4,3,u,3>: Cost 2 vmrghw RHS, <3,3,3,3>
-  2244291074U, // <4,3,u,4>: Cost 2 vmrghw RHS, <3,4,5,6>
-  3832761158U, // <4,3,u,5>: Cost 3 vsldoi12 <1,2,3,4>, <3,u,5,6>
-  3318033016U, // <4,3,u,6>: Cost 3 vmrghw RHS, <3,6,0,7>
-  3369740218U, // <4,3,u,7>: Cost 3 vmrglw <2,3,4,u>, <2,6,3,7>
-  2244291358U, // <4,3,u,u>: Cost 2 vmrghw RHS, <3,u,1,2>
-  2238860178U, // <4,4,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
-  2711224422U, // <4,4,0,1>: Cost 2 vsldoi8 <4,4,4,4>, LHS
+  2731792030U, // <4,3,7,u>: Cost 3 vsldoi8 <7,u,4,3>, <7,u,4,3>
+  1170548886U, // <4,3,u,0>: Cost 2 vmrghw RHS, <3,0,1,2>
+  2759019294U, // <4,3,u,1>: Cost 3 vsldoi12 <1,2,3,4>, <3,u,1,2>
+  2632132377U, // <4,3,u,2>: Cost 3 vsldoi4 <2,4,3,u>, <2,4,3,u>
+  1170549148U, // <4,3,u,3>: Cost 2 vmrghw RHS, <3,3,3,3>
+  1170549250U, // <4,3,u,4>: Cost 2 vmrghw RHS, <3,4,5,6>
+  2759019334U, // <4,3,u,5>: Cost 3 vsldoi12 <1,2,3,4>, <3,u,5,6>
+  2244291192U, // <4,3,u,6>: Cost 3 vmrghw RHS, <3,6,0,7>
+  2295998394U, // <4,3,u,7>: Cost 3 vmrglw <2,3,4,u>, <2,6,3,7>
+  1170549534U, // <4,3,u,u>: Cost 2 vmrghw RHS, <3,u,1,2>
+  1165118354U, // <4,4,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
+  1637482598U, // <4,4,0,1>: Cost 2 vsldoi8 <4,4,4,4>, LHS
   3711854285U, // <4,4,0,2>: Cost 4 vsldoi4 <3,4,4,0>, <2,3,4,4>
   3827305344U, // <4,4,0,3>: Cost 4 vsldoi12 <0,3,1,4>, <4,0,3,1>
-  3784966482U, // <4,4,0,4>: Cost 3 vsldoi8 <4,4,4,4>, <0,4,1,5>
-  2238860598U, // <4,4,0,5>: Cost 2 vmrghw <4,0,5,1>, RHS
+  2711224658U, // <4,4,0,4>: Cost 3 vsldoi8 <4,4,4,4>, <0,4,1,5>
+  1165118774U, // <4,4,0,5>: Cost 2 vmrghw <4,0,5,1>, RHS
   3312602489U, // <4,4,0,6>: Cost 4 vmrghw <4,0,5,1>, <4,6,5,2>
   3369675420U, // <4,4,0,7>: Cost 4 vmrglw <2,3,4,0>, <3,6,4,7>
-  2238860841U, // <4,4,0,u>: Cost 2 vmrghw <4,0,5,1>, RHS
+  1165119017U, // <4,4,0,u>: Cost 2 vmrghw <4,0,5,1>, RHS
   3369682633U, // <4,4,1,0>: Cost 4 vmrglw <2,3,4,1>, <2,3,4,0>
-  3361055405U, // <4,4,1,1>: Cost 3 vmrglw <0,u,4,1>, <0,u,4,1>
-  3832761290U, // <4,4,1,2>: Cost 3 vsldoi12 <1,2,3,4>, <4,1,2,3>
+  2287313581U, // <4,4,1,1>: Cost 3 vmrglw <0,u,4,1>, <0,u,4,1>
+  2759019466U, // <4,4,1,2>: Cost 3 vsldoi12 <1,2,3,4>, <4,1,2,3>
   3369683284U, // <4,4,1,3>: Cost 4 vmrglw <2,3,4,1>, <3,2,4,3>
-  3384945872U, // <4,4,1,4>: Cost 3 vmrglw <4,u,4,1>, <4,4,4,4>
-  3313061174U, // <4,4,1,5>: Cost 3 vmrghw <4,1,2,3>, RHS
+  2311204048U, // <4,4,1,4>: Cost 3 vmrglw <4,u,4,1>, <4,4,4,4>
+  2239319350U, // <4,4,1,5>: Cost 3 vmrghw <4,1,2,3>, RHS
   3784967411U, // <4,4,1,6>: Cost 4 vsldoi8 <4,4,4,4>, <1,6,5,7>
   3369683612U, // <4,4,1,7>: Cost 4 vmrglw <2,3,4,1>, <3,6,4,7>
-  3836742656U, // <4,4,1,u>: Cost 3 vsldoi12 <1,u,3,4>, <4,1,u,3>
+  2763000832U, // <4,4,1,u>: Cost 3 vsldoi12 <1,u,3,4>, <4,1,u,3>
   3711869030U, // <4,4,2,0>: Cost 4 vsldoi4 <3,4,4,2>, LHS
   3711869850U, // <4,4,2,1>: Cost 4 vsldoi4 <3,4,4,2>, <1,2,3,4>
-  3313945654U, // <4,4,2,2>: Cost 3 vmrghw <4,2,5,3>, <4,2,5,3>
-  3772360397U, // <4,4,2,3>: Cost 3 vsldoi8 <2,3,4,4>, <2,3,4,4>
-  3784967957U, // <4,4,2,4>: Cost 3 vsldoi8 <4,4,4,4>, <2,4,3,4>
-  3313945910U, // <4,4,2,5>: Cost 3 vmrghw <4,2,5,3>, RHS
-  3784968122U, // <4,4,2,6>: Cost 3 vsldoi8 <4,4,4,4>, <2,6,3,7>
+  2240203830U, // <4,4,2,2>: Cost 3 vmrghw <4,2,5,3>, <4,2,5,3>
+  2698618573U, // <4,4,2,3>: Cost 3 vsldoi8 <2,3,4,4>, <2,3,4,4>
+  2711226133U, // <4,4,2,4>: Cost 3 vsldoi8 <4,4,4,4>, <2,4,3,4>
+  2240204086U, // <4,4,2,5>: Cost 3 vmrghw <4,2,5,3>, RHS
+  2711226298U, // <4,4,2,6>: Cost 3 vsldoi8 <4,4,4,4>, <2,6,3,7>
   3832761416U, // <4,4,2,7>: Cost 4 vsldoi12 <1,2,3,4>, <4,2,7,3>
-  3775678562U, // <4,4,2,u>: Cost 3 vsldoi8 <2,u,4,4>, <2,u,4,4>
-  3784968342U, // <4,4,3,0>: Cost 3 vsldoi8 <4,4,4,4>, <3,0,1,2>
+  2701936738U, // <4,4,2,u>: Cost 3 vsldoi8 <2,u,4,4>, <2,u,4,4>
+  2711226518U, // <4,4,3,0>: Cost 3 vsldoi8 <4,4,4,4>, <3,0,1,2>
   3777005828U, // <4,4,3,1>: Cost 4 vsldoi8 <3,1,4,4>, <3,1,4,4>
   3832761453U, // <4,4,3,2>: Cost 4 vsldoi12 <1,2,3,4>, <4,3,2,4>
-  3375008084U, // <4,4,3,3>: Cost 3 vmrglw <3,2,4,3>, <3,2,4,3>
-  3778996727U, // <4,4,3,4>: Cost 3 vsldoi8 <3,4,4,4>, <3,4,4,4>
-  3314584886U, // <4,4,3,5>: Cost 3 vmrghw <4,3,5,0>, RHS
+  2301266260U, // <4,4,3,3>: Cost 3 vmrglw <3,2,4,3>, <3,2,4,3>
+  2705254903U, // <4,4,3,4>: Cost 3 vsldoi8 <3,4,4,4>, <3,4,4,4>
+  2240843062U, // <4,4,3,5>: Cost 3 vmrghw <4,3,5,0>, RHS
   3832761489U, // <4,4,3,6>: Cost 4 vsldoi12 <1,2,3,4>, <4,3,6,4>
   3375008412U, // <4,4,3,7>: Cost 4 vmrglw <3,2,4,3>, <3,6,4,7>
-  3375008084U, // <4,4,3,u>: Cost 3 vmrglw <3,2,4,3>, <3,2,4,3>
-  2644115558U, // <4,4,4,0>: Cost 2 vsldoi4 <4,4,4,4>, LHS
-  3382315913U, // <4,4,4,1>: Cost 3 vmrglw <4,4,4,4>, <4,0,4,1>
-  3717858920U, // <4,4,4,2>: Cost 3 vsldoi4 <4,4,4,4>, <2,2,2,2>
-  3711887863U, // <4,4,4,3>: Cost 3 vsldoi4 <3,4,4,4>, <3,4,4,4>
-  1302777142U, // <4,4,4,4>: Cost 1 vspltisw0 RHS
-  2241465654U, // <4,4,4,5>: Cost 2 vmrghw <4,4,4,4>, RHS
-  3717861882U, // <4,4,4,6>: Cost 3 vsldoi4 <4,4,4,4>, <6,2,7,3>
-  3735778651U, // <4,4,4,7>: Cost 3 vsldoi4 <7,4,4,4>, <7,4,4,4>
-  1302777142U, // <4,4,4,u>: Cost 1 vspltisw0 RHS
-  2242300818U, // <4,4,5,0>: Cost 2 vmrghw RHS, <4,0,5,1>
-  3711894426U, // <4,4,5,1>: Cost 3 vsldoi4 <3,4,4,5>, <1,2,3,4>
-  3316042805U, // <4,4,5,2>: Cost 3 vmrghw RHS, <4,2,5,2>
-  3711896056U, // <4,4,5,3>: Cost 3 vsldoi4 <3,4,4,5>, <3,4,4,5>
-  2242301146U, // <4,4,5,4>: Cost 2 vmrghw RHS, <4,4,5,5>
-  1168559414U, // <4,4,5,5>: Cost 1 vmrghw RHS, RHS
-  2759019830U, // <4,4,5,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
-  3316051400U, // <4,4,5,7>: Cost 3 vmrghw RHS, <4,7,5,0>
-  1168559657U, // <4,4,5,u>: Cost 1 vmrghw RHS, RHS
+  2301266260U, // <4,4,3,u>: Cost 3 vmrglw <3,2,4,3>, <3,2,4,3>
+  1570373734U, // <4,4,4,0>: Cost 2 vsldoi4 <4,4,4,4>, LHS
+  2308574089U, // <4,4,4,1>: Cost 3 vmrglw <4,4,4,4>, <4,0,4,1>
+  2644117096U, // <4,4,4,2>: Cost 3 vsldoi4 <4,4,4,4>, <2,2,2,2>
+  2638146039U, // <4,4,4,3>: Cost 3 vsldoi4 <3,4,4,4>, <3,4,4,4>
+  229035318U,  // <4,4,4,4>: Cost 1 vspltisw0 RHS
+  1167723830U, // <4,4,4,5>: Cost 2 vmrghw <4,4,4,4>, RHS
+  2644120058U, // <4,4,4,6>: Cost 3 vsldoi4 <4,4,4,4>, <6,2,7,3>
+  2662036827U, // <4,4,4,7>: Cost 3 vsldoi4 <7,4,4,4>, <7,4,4,4>
+  229035318U,  // <4,4,4,u>: Cost 1 vspltisw0 RHS
+  1168558994U, // <4,4,5,0>: Cost 2 vmrghw RHS, <4,0,5,1>
+  2638152602U, // <4,4,5,1>: Cost 3 vsldoi4 <3,4,4,5>, <1,2,3,4>
+  2242300981U, // <4,4,5,2>: Cost 3 vmrghw RHS, <4,2,5,2>
+  2638154232U, // <4,4,5,3>: Cost 3 vsldoi4 <3,4,4,5>, <3,4,4,5>
+  1168559322U, // <4,4,5,4>: Cost 2 vmrghw RHS, <4,4,5,5>
+  94817590U,   // <4,4,5,5>: Cost 1 vmrghw RHS, RHS
+  1685278006U, // <4,4,5,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
+  2242309576U, // <4,4,5,7>: Cost 3 vmrghw RHS, <4,7,5,0>
+  94817833U,   // <4,4,5,u>: Cost 1 vmrghw RHS, RHS
   3316591506U, // <4,4,6,0>: Cost 4 vmrghw <4,6,5,2>, <4,0,5,1>
   3758428587U, // <4,4,6,1>: Cost 4 vsldoi8 <0,0,4,4>, <6,1,7,5>
-  3784970746U, // <4,4,6,2>: Cost 3 vsldoi8 <4,4,4,4>, <6,2,7,3>
+  2711228922U, // <4,4,6,2>: Cost 3 vsldoi8 <4,4,4,4>, <6,2,7,3>
   3796251185U, // <4,4,6,3>: Cost 4 vsldoi8 <6,3,4,4>, <6,3,4,4>
-  3784970909U, // <4,4,6,4>: Cost 3 vsldoi8 <4,4,4,4>, <6,4,7,4>
-  3316591926U, // <4,4,6,5>: Cost 3 vmrghw <4,6,5,2>, RHS
-  3316591993U, // <4,4,6,6>: Cost 3 vmrghw <4,6,5,2>, <4,6,5,2>
-  3798905717U, // <4,4,6,7>: Cost 3 vsldoi8 <6,7,4,4>, <6,7,4,4>
-  3316592169U, // <4,4,6,u>: Cost 3 vmrghw <4,6,5,2>, RHS
-  3784971258U, // <4,4,7,0>: Cost 3 vsldoi8 <4,4,4,4>, <7,0,1,2>
+  2711229085U, // <4,4,6,4>: Cost 3 vsldoi8 <4,4,4,4>, <6,4,7,4>
+  2242850102U, // <4,4,6,5>: Cost 3 vmrghw <4,6,5,2>, RHS
+  2242850169U, // <4,4,6,6>: Cost 3 vmrghw <4,6,5,2>, <4,6,5,2>
+  2725163893U, // <4,4,6,7>: Cost 3 vsldoi8 <6,7,4,4>, <6,7,4,4>
+  2242850345U, // <4,4,6,u>: Cost 3 vmrghw <4,6,5,2>, RHS
+  2711229434U, // <4,4,7,0>: Cost 3 vsldoi8 <4,4,4,4>, <7,0,1,2>
   3377694410U, // <4,4,7,1>: Cost 4 vmrglw <3,6,4,7>, <2,3,4,1>
   3868593584U, // <4,4,7,2>: Cost 4 vsldoi12 <7,2,3,4>, <4,7,2,3>
   3377695060U, // <4,4,7,3>: Cost 4 vmrglw <3,6,4,7>, <3,2,4,3>
-  3802887515U, // <4,4,7,4>: Cost 3 vsldoi8 <7,4,4,4>, <7,4,4,4>
-  3317239094U, // <4,4,7,5>: Cost 3 vmrghw <4,7,5,0>, RHS
+  2729145691U, // <4,4,7,4>: Cost 3 vsldoi8 <7,4,4,4>, <7,4,4,4>
+  2243497270U, // <4,4,7,5>: Cost 3 vmrghw <4,7,5,0>, RHS
   3871542744U, // <4,4,7,6>: Cost 4 vsldoi12 <7,6,7,4>, <4,7,6,7>
-  3377695388U, // <4,4,7,7>: Cost 3 vmrglw <3,6,4,7>, <3,6,4,7>
-  3317239337U, // <4,4,7,u>: Cost 3 vmrghw <4,7,5,0>, RHS
-  2244291474U, // <4,4,u,0>: Cost 2 vmrghw RHS, <4,0,5,1>
-  2711230254U, // <4,4,u,1>: Cost 2 vsldoi8 <4,4,4,4>, LHS
-  3318033461U, // <4,4,u,2>: Cost 3 vmrghw RHS, <4,2,5,2>
-  3711920635U, // <4,4,u,3>: Cost 3 vsldoi4 <3,4,4,u>, <3,4,4,u>
-  1302777142U, // <4,4,u,4>: Cost 1 vspltisw0 RHS
-  1170550070U, // <4,4,u,5>: Cost 1 vmrghw RHS, RHS
-  2759020073U, // <4,4,u,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
-  3318033864U, // <4,4,u,7>: Cost 3 vmrghw RHS, <4,7,5,0>
-  1170550313U, // <4,4,u,u>: Cost 1 vmrghw RHS, RHS
-  3772366848U, // <4,5,0,0>: Cost 3 vsldoi8 <2,3,4,5>, <0,0,0,0>
-  2698625126U, // <4,5,0,1>: Cost 2 vsldoi8 <2,3,4,5>, LHS
-  3711928014U, // <4,5,0,2>: Cost 3 vsldoi4 <3,4,5,0>, <2,3,4,5>
-  3711928828U, // <4,5,0,3>: Cost 3 vsldoi4 <3,4,5,0>, <3,4,5,0>
-  3761086829U, // <4,5,0,4>: Cost 3 vsldoi8 <0,4,4,5>, <0,4,4,5>
-  3312603140U, // <4,5,0,5>: Cost 3 vmrghw <4,0,5,1>, <5,5,5,5>
-  3735819126U, // <4,5,0,6>: Cost 3 vsldoi4 <7,4,5,0>, <6,7,4,5>
-  3735819616U, // <4,5,0,7>: Cost 3 vsldoi4 <7,4,5,0>, <7,4,5,0>
-  2698625693U, // <4,5,0,u>: Cost 2 vsldoi8 <2,3,4,5>, LHS
+  2303953564U, // <4,4,7,7>: Cost 3 vmrglw <3,6,4,7>, <3,6,4,7>
+  2243497513U, // <4,4,7,u>: Cost 3 vmrghw <4,7,5,0>, RHS
+  1170549650U, // <4,4,u,0>: Cost 2 vmrghw RHS, <4,0,5,1>
+  1637488430U, // <4,4,u,1>: Cost 2 vsldoi8 <4,4,4,4>, LHS
+  2244291637U, // <4,4,u,2>: Cost 3 vmrghw RHS, <4,2,5,2>
+  2638178811U, // <4,4,u,3>: Cost 3 vsldoi4 <3,4,4,u>, <3,4,4,u>
+  229035318U,  // <4,4,u,4>: Cost 1 vspltisw0 RHS
+  96808246U,   // <4,4,u,5>: Cost 1 vmrghw RHS, RHS
+  1685278249U, // <4,4,u,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
+  2244292040U, // <4,4,u,7>: Cost 3 vmrghw RHS, <4,7,5,0>
+  96808489U,   // <4,4,u,u>: Cost 1 vmrghw RHS, RHS
+  2698625024U, // <4,5,0,0>: Cost 3 vsldoi8 <2,3,4,5>, <0,0,0,0>
+  1624883302U, // <4,5,0,1>: Cost 2 vsldoi8 <2,3,4,5>, LHS
+  2638186190U, // <4,5,0,2>: Cost 3 vsldoi4 <3,4,5,0>, <2,3,4,5>
+  2638187004U, // <4,5,0,3>: Cost 3 vsldoi4 <3,4,5,0>, <3,4,5,0>
+  2687345005U, // <4,5,0,4>: Cost 3 vsldoi8 <0,4,4,5>, <0,4,4,5>
+  2238861316U, // <4,5,0,5>: Cost 3 vmrghw <4,0,5,1>, <5,5,5,5>
+  2662077302U, // <4,5,0,6>: Cost 3 vsldoi4 <7,4,5,0>, <6,7,4,5>
+  2662077792U, // <4,5,0,7>: Cost 3 vsldoi4 <7,4,5,0>, <7,4,5,0>
+  1624883869U, // <4,5,0,u>: Cost 2 vsldoi8 <2,3,4,5>, LHS
   3361057762U, // <4,5,1,0>: Cost 4 vmrglw <0,u,4,1>, <4,1,5,0>
-  3765068627U, // <4,5,1,1>: Cost 3 vsldoi8 <1,1,4,5>, <1,1,4,5>
-  3772367766U, // <4,5,1,2>: Cost 3 vsldoi8 <2,3,4,5>, <1,2,3,0>
+  2691326803U, // <4,5,1,1>: Cost 3 vsldoi8 <1,1,4,5>, <1,1,4,5>
+  2698625942U, // <4,5,1,2>: Cost 3 vsldoi8 <2,3,4,5>, <1,2,3,0>
   3361055659U, // <4,5,1,3>: Cost 4 vmrglw <0,u,4,1>, <1,2,5,3>
   3761087567U, // <4,5,1,4>: Cost 4 vsldoi8 <0,4,4,5>, <1,4,5,5>
-  3767723159U, // <4,5,1,5>: Cost 3 vsldoi8 <1,5,4,5>, <1,5,4,5>
-  3378973186U, // <4,5,1,6>: Cost 3 vmrglw <3,u,4,1>, <3,4,5,6>
+  2693981335U, // <4,5,1,5>: Cost 3 vsldoi8 <1,5,4,5>, <1,5,4,5>
+  2305231362U, // <4,5,1,6>: Cost 3 vmrglw <3,u,4,1>, <3,4,5,6>
   3361055987U, // <4,5,1,7>: Cost 4 vmrglw <0,u,4,1>, <1,6,5,7>
-  3769714058U, // <4,5,1,u>: Cost 3 vsldoi8 <1,u,4,5>, <1,u,4,5>
-  3711942758U, // <4,5,2,0>: Cost 3 vsldoi4 <3,4,5,2>, LHS
+  2695972234U, // <4,5,1,u>: Cost 3 vsldoi8 <1,u,4,5>, <1,u,4,5>
+  2638200934U, // <4,5,2,0>: Cost 3 vsldoi4 <3,4,5,2>, LHS
   3761088035U, // <4,5,2,1>: Cost 4 vsldoi8 <0,4,4,5>, <2,1,3,5>
-  3771704957U, // <4,5,2,2>: Cost 3 vsldoi8 <2,2,4,5>, <2,2,4,5>
-  2698626766U, // <4,5,2,3>: Cost 2 vsldoi8 <2,3,4,5>, <2,3,4,5>
-  3772368662U, // <4,5,2,4>: Cost 3 vsldoi8 <2,3,4,5>, <2,4,3,5>
+  2697963133U, // <4,5,2,2>: Cost 3 vsldoi8 <2,2,4,5>, <2,2,4,5>
+  1624884942U, // <4,5,2,3>: Cost 2 vsldoi8 <2,3,4,5>, <2,3,4,5>
+  2698626838U, // <4,5,2,4>: Cost 3 vsldoi8 <2,3,4,5>, <2,4,3,5>
   3772368744U, // <4,5,2,5>: Cost 4 vsldoi8 <2,3,4,5>, <2,5,3,6>
-  3772368826U, // <4,5,2,6>: Cost 3 vsldoi8 <2,3,4,5>, <2,6,3,7>
+  2698627002U, // <4,5,2,6>: Cost 3 vsldoi8 <2,3,4,5>, <2,6,3,7>
   3775023122U, // <4,5,2,7>: Cost 4 vsldoi8 <2,7,4,5>, <2,7,4,5>
-  2701944931U, // <4,5,2,u>: Cost 2 vsldoi8 <2,u,4,5>, <2,u,4,5>
-  3772369046U, // <4,5,3,0>: Cost 3 vsldoi8 <2,3,4,5>, <3,0,1,2>
+  1628203107U, // <4,5,2,u>: Cost 2 vsldoi8 <2,u,4,5>, <2,u,4,5>
+  2698627222U, // <4,5,3,0>: Cost 3 vsldoi8 <2,3,4,5>, <3,0,1,2>
   3765070057U, // <4,5,3,1>: Cost 4 vsldoi8 <1,1,4,5>, <3,1,1,4>
-  3772369228U, // <4,5,3,2>: Cost 3 vsldoi8 <2,3,4,5>, <3,2,3,4>
-  3772369308U, // <4,5,3,3>: Cost 3 vsldoi8 <2,3,4,5>, <3,3,3,3>
-  3772369404U, // <4,5,3,4>: Cost 3 vsldoi8 <2,3,4,5>, <3,4,5,0>
+  2698627404U, // <4,5,3,2>: Cost 3 vsldoi8 <2,3,4,5>, <3,2,3,4>
+  2698627484U, // <4,5,3,3>: Cost 3 vsldoi8 <2,3,4,5>, <3,3,3,3>
+  2698627580U, // <4,5,3,4>: Cost 3 vsldoi8 <2,3,4,5>, <3,4,5,0>
   3779668553U, // <4,5,3,5>: Cost 4 vsldoi8 <3,5,4,5>, <3,5,4,5>
-  3798911668U, // <4,5,3,6>: Cost 3 vsldoi8 <6,7,4,5>, <3,6,7,4>
-  3780995819U, // <4,5,3,7>: Cost 3 vsldoi8 <3,7,4,5>, <3,7,4,5>
-  3772369694U, // <4,5,3,u>: Cost 3 vsldoi8 <2,3,4,5>, <3,u,1,2>
-  3711959142U, // <4,5,4,0>: Cost 3 vsldoi4 <3,4,5,4>, LHS
-  3382315922U, // <4,5,4,1>: Cost 3 vmrglw <4,4,4,4>, <4,0,5,1>
-  3772369974U, // <4,5,4,2>: Cost 3 vsldoi8 <2,3,4,5>, <4,2,5,3>
-  3711961600U, // <4,5,4,3>: Cost 3 vsldoi4 <3,4,5,4>, <3,4,5,4>
-  3772370138U, // <4,5,4,4>: Cost 3 vsldoi8 <2,3,4,5>, <4,4,5,5>
-  2698628406U, // <4,5,4,5>: Cost 2 vsldoi8 <2,3,4,5>, RHS
-  3772370302U, // <4,5,4,6>: Cost 3 vsldoi8 <2,3,4,5>, <4,6,5,7>
-  3735852388U, // <4,5,4,7>: Cost 3 vsldoi4 <7,4,5,4>, <7,4,5,4>
-  2698628649U, // <4,5,4,u>: Cost 2 vsldoi8 <2,3,4,5>, RHS
-  2644197478U, // <4,5,5,0>: Cost 2 vsldoi4 <4,4,5,5>, LHS
-  3386306074U, // <4,5,5,1>: Cost 3 vmrglw <5,1,4,5>, <4,u,5,1>
-  3717940942U, // <4,5,5,2>: Cost 3 vsldoi4 <4,4,5,5>, <2,3,4,5>
-  3369716790U, // <4,5,5,3>: Cost 3 vmrglw <2,3,4,5>, <4,2,5,3>
-  2644200666U, // <4,5,5,4>: Cost 2 vsldoi4 <4,4,5,5>, <4,4,5,5>
-  2242310148U, // <4,5,5,5>: Cost 2 vmrghw RHS, <5,5,5,5>
-  2242310242U, // <4,5,5,6>: Cost 2 vmrghw RHS, <5,6,7,0>
-  3369717118U, // <4,5,5,7>: Cost 3 vmrglw <2,3,4,5>, <4,6,5,7>
-  2242457860U, // <4,5,5,u>: Cost 2 vmrghw RHS, <5,u,7,0>
-  2638233702U, // <4,5,6,0>: Cost 2 vsldoi4 <3,4,5,6>, LHS
-  3700032592U, // <4,5,6,1>: Cost 3 vsldoi4 <1,4,5,6>, <1,4,5,6>
-  3706005289U, // <4,5,6,2>: Cost 3 vsldoi4 <2,4,5,6>, <2,4,5,6>
-  2638236162U, // <4,5,6,3>: Cost 2 vsldoi4 <3,4,5,6>, <3,4,5,6>
-  2638236982U, // <4,5,6,4>: Cost 2 vsldoi4 <3,4,5,6>, RHS
-  3711979288U, // <4,5,6,5>: Cost 3 vsldoi4 <3,4,5,6>, <5,2,6,3>
-  3729896077U, // <4,5,6,6>: Cost 3 vsldoi4 <6,4,5,6>, <6,4,5,6>
+  2725169844U, // <4,5,3,6>: Cost 3 vsldoi8 <6,7,4,5>, <3,6,7,4>
+  2707253995U, // <4,5,3,7>: Cost 3 vsldoi8 <3,7,4,5>, <3,7,4,5>
+  2698627870U, // <4,5,3,u>: Cost 3 vsldoi8 <2,3,4,5>, <3,u,1,2>
+  2638217318U, // <4,5,4,0>: Cost 3 vsldoi4 <3,4,5,4>, LHS
+  2308574098U, // <4,5,4,1>: Cost 3 vmrglw <4,4,4,4>, <4,0,5,1>
+  2698628150U, // <4,5,4,2>: Cost 3 vsldoi8 <2,3,4,5>, <4,2,5,3>
+  2638219776U, // <4,5,4,3>: Cost 3 vsldoi4 <3,4,5,4>, <3,4,5,4>
+  2698628314U, // <4,5,4,4>: Cost 3 vsldoi8 <2,3,4,5>, <4,4,5,5>
+  1624886582U, // <4,5,4,5>: Cost 2 vsldoi8 <2,3,4,5>, RHS
+  2698628478U, // <4,5,4,6>: Cost 3 vsldoi8 <2,3,4,5>, <4,6,5,7>
+  2662110564U, // <4,5,4,7>: Cost 3 vsldoi4 <7,4,5,4>, <7,4,5,4>
+  1624886825U, // <4,5,4,u>: Cost 2 vsldoi8 <2,3,4,5>, RHS
+  1570455654U, // <4,5,5,0>: Cost 2 vsldoi4 <4,4,5,5>, LHS
+  2312564250U, // <4,5,5,1>: Cost 3 vmrglw <5,1,4,5>, <4,u,5,1>
+  2644199118U, // <4,5,5,2>: Cost 3 vsldoi4 <4,4,5,5>, <2,3,4,5>
+  2295974966U, // <4,5,5,3>: Cost 3 vmrglw <2,3,4,5>, <4,2,5,3>
+  1570458842U, // <4,5,5,4>: Cost 2 vsldoi4 <4,4,5,5>, <4,4,5,5>
+  1168568324U, // <4,5,5,5>: Cost 2 vmrghw RHS, <5,5,5,5>
+  1168568418U, // <4,5,5,6>: Cost 2 vmrghw RHS, <5,6,7,0>
+  2295975294U, // <4,5,5,7>: Cost 3 vmrglw <2,3,4,5>, <4,6,5,7>
+  1168716036U, // <4,5,5,u>: Cost 2 vmrghw RHS, <5,u,7,0>
+  1564491878U, // <4,5,6,0>: Cost 2 vsldoi4 <3,4,5,6>, LHS
+  2626290768U, // <4,5,6,1>: Cost 3 vsldoi4 <1,4,5,6>, <1,4,5,6>
+  2632263465U, // <4,5,6,2>: Cost 3 vsldoi4 <2,4,5,6>, <2,4,5,6>
+  1564494338U, // <4,5,6,3>: Cost 2 vsldoi4 <3,4,5,6>, <3,4,5,6>
+  1564495158U, // <4,5,6,4>: Cost 2 vsldoi4 <3,4,5,6>, RHS
+  2638237464U, // <4,5,6,5>: Cost 3 vsldoi4 <3,4,5,6>, <5,2,6,3>
+  2656154253U, // <4,5,6,6>: Cost 3 vsldoi4 <6,4,5,6>, <6,4,5,6>
   27705344U,   // <4,5,6,7>: Cost 0 copy RHS
   27705344U,   // <4,5,6,u>: Cost 0 copy RHS
-  3798914042U, // <4,5,7,0>: Cost 3 vsldoi8 <6,7,4,5>, <7,0,1,2>
+  2725172218U, // <4,5,7,0>: Cost 3 vsldoi8 <6,7,4,5>, <7,0,1,2>
   3859599489U, // <4,5,7,1>: Cost 4 vsldoi12 <5,6,7,4>, <5,7,1,4>
-  3772372144U, // <4,5,7,2>: Cost 3 vsldoi8 <2,3,4,5>, <7,2,3,4>
-  3802232075U, // <4,5,7,3>: Cost 3 vsldoi8 <7,3,4,5>, <7,3,4,5>
-  3798914400U, // <4,5,7,4>: Cost 3 vsldoi8 <6,7,4,5>, <7,4,5,0>
+  2698630320U, // <4,5,7,2>: Cost 3 vsldoi8 <2,3,4,5>, <7,2,3,4>
+  2728490251U, // <4,5,7,3>: Cost 3 vsldoi8 <7,3,4,5>, <7,3,4,5>
+  2725172576U, // <4,5,7,4>: Cost 3 vsldoi8 <6,7,4,5>, <7,4,5,0>
   3317239812U, // <4,5,7,5>: Cost 4 vmrghw <4,7,5,0>, <5,5,5,5>
-  3798914584U, // <4,5,7,6>: Cost 3 vsldoi8 <6,7,4,5>, <7,6,7,4>
-  3798914668U, // <4,5,7,7>: Cost 3 vsldoi8 <6,7,4,5>, <7,7,7,7>
-  3798914690U, // <4,5,7,u>: Cost 3 vsldoi8 <6,7,4,5>, <7,u,1,2>
-  2638250086U, // <4,5,u,0>: Cost 2 vsldoi4 <3,4,5,u>, LHS
-  2698630958U, // <4,5,u,1>: Cost 2 vsldoi8 <2,3,4,5>, LHS
-  3772372869U, // <4,5,u,2>: Cost 3 vsldoi8 <2,3,4,5>, <u,2,3,0>
-  2638252548U, // <4,5,u,3>: Cost 2 vsldoi4 <3,4,5,u>, <3,4,5,u>
-  2638253366U, // <4,5,u,4>: Cost 2 vsldoi4 <3,4,5,u>, RHS
-  2698631322U, // <4,5,u,5>: Cost 2 vsldoi8 <2,3,4,5>, RHS
-  2244292706U, // <4,5,u,6>: Cost 2 vmrghw RHS, <5,6,7,0>
+  2725172760U, // <4,5,7,6>: Cost 3 vsldoi8 <6,7,4,5>, <7,6,7,4>
+  2725172844U, // <4,5,7,7>: Cost 3 vsldoi8 <6,7,4,5>, <7,7,7,7>
+  2725172866U, // <4,5,7,u>: Cost 3 vsldoi8 <6,7,4,5>, <7,u,1,2>
+  1564508262U, // <4,5,u,0>: Cost 2 vsldoi4 <3,4,5,u>, LHS
+  1624889134U, // <4,5,u,1>: Cost 2 vsldoi8 <2,3,4,5>, LHS
+  2698631045U, // <4,5,u,2>: Cost 3 vsldoi8 <2,3,4,5>, <u,2,3,0>
+  1564510724U, // <4,5,u,3>: Cost 2 vsldoi4 <3,4,5,u>, <3,4,5,u>
+  1564511542U, // <4,5,u,4>: Cost 2 vsldoi4 <3,4,5,u>, RHS
+  1624889498U, // <4,5,u,5>: Cost 2 vsldoi8 <2,3,4,5>, RHS
+  1170550882U, // <4,5,u,6>: Cost 2 vmrghw RHS, <5,6,7,0>
   27705344U,   // <4,5,u,7>: Cost 0 copy RHS
   27705344U,   // <4,5,u,u>: Cost 0 copy RHS
   3312595285U, // <4,6,0,0>: Cost 4 vmrghw <4,0,5,0>, <6,0,7,0>
   3763748966U, // <4,6,0,1>: Cost 4 vsldoi8 <0,u,4,6>, LHS
-  3312603642U, // <4,6,0,2>: Cost 3 vmrghw <4,0,5,1>, <6,2,7,3>
+  2238861818U, // <4,6,0,2>: Cost 3 vmrghw <4,0,5,1>, <6,2,7,3>
   3767730432U, // <4,6,0,3>: Cost 4 vsldoi8 <1,5,4,6>, <0,3,1,4>
   3763749202U, // <4,6,0,4>: Cost 4 vsldoi8 <0,u,4,6>, <0,4,1,5>
-  3312603883U, // <4,6,0,5>: Cost 3 vmrghw <4,0,5,1>, <6,5,7,1>
-  3312603960U, // <4,6,0,6>: Cost 3 vmrghw <4,0,5,1>, <6,6,6,6>
-  3369676086U, // <4,6,0,7>: Cost 3 vmrglw <2,3,4,0>, RHS
-  3369676087U, // <4,6,0,u>: Cost 3 vmrglw <2,3,4,0>, RHS
+  2238862059U, // <4,6,0,5>: Cost 3 vmrghw <4,0,5,1>, <6,5,7,1>
+  2238862136U, // <4,6,0,6>: Cost 3 vmrghw <4,0,5,1>, <6,6,6,6>
+  2295934262U, // <4,6,0,7>: Cost 3 vmrglw <2,3,4,0>, RHS
+  2295934263U, // <4,6,0,u>: Cost 3 vmrglw <2,3,4,0>, RHS
   3378973999U, // <4,6,1,0>: Cost 4 vmrglw <3,u,4,1>, <4,5,6,0>
   3378974648U, // <4,6,1,1>: Cost 4 vmrglw <3,u,4,1>, <5,4,6,1>
   3779675034U, // <4,6,1,2>: Cost 4 vsldoi8 <3,5,4,6>, <1,2,3,4>
@@ -3439,8 +3439,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3378974003U, // <4,6,1,4>: Cost 4 vmrglw <3,u,4,1>, <4,5,6,4>
   3767731352U, // <4,6,1,5>: Cost 4 vsldoi8 <1,5,4,6>, <1,5,4,6>
   3378974734U, // <4,6,1,6>: Cost 4 vmrglw <3,u,4,1>, <5,5,6,6>
-  3361058102U, // <4,6,1,7>: Cost 3 vmrglw <0,u,4,1>, RHS
-  3361058103U, // <4,6,1,u>: Cost 3 vmrglw <0,u,4,1>, RHS
+  2287316278U, // <4,6,1,7>: Cost 3 vmrglw <0,u,4,1>, RHS
+  2287316279U, // <4,6,1,u>: Cost 3 vmrglw <0,u,4,1>, RHS
   3735904358U, // <4,6,2,0>: Cost 4 vsldoi4 <7,4,6,2>, LHS
   3763750435U, // <4,6,2,1>: Cost 5 vsldoi8 <0,u,4,6>, <2,1,3,5>
   3313938937U, // <4,6,2,2>: Cost 4 vmrghw <4,2,5,2>, <6,2,7,2>
@@ -3448,8 +3448,8 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3852890591U, // <4,6,2,4>: Cost 4 vsldoi12 <4,5,6,4>, <6,2,4,3>
   3735908454U, // <4,6,2,5>: Cost 4 vsldoi4 <7,4,6,2>, <5,6,7,4>
   3801573306U, // <4,6,2,6>: Cost 4 vsldoi8 <7,2,4,6>, <2,6,3,7>
-  3859599866U, // <4,6,2,7>: Cost 3 vsldoi12 <5,6,7,4>, <6,2,7,3>
-  3859599875U, // <4,6,2,u>: Cost 3 vsldoi12 <5,6,7,4>, <6,2,u,3>
+  2785858042U, // <4,6,2,7>: Cost 3 vsldoi12 <5,6,7,4>, <6,2,7,3>
+  2785858051U, // <4,6,2,u>: Cost 3 vsldoi12 <5,6,7,4>, <6,2,u,3>
   3863065101U, // <4,6,3,0>: Cost 4 vsldoi12 <6,3,0,4>, <6,3,0,4>
   3314586024U, // <4,6,3,1>: Cost 4 vmrghw <4,3,5,0>, <6,1,7,2>
   3863212575U, // <4,6,3,2>: Cost 4 vsldoi12 <6,3,2,4>, <6,3,2,4>
@@ -3457,1052 +3457,1052 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3767732738U, // <4,6,3,4>: Cost 4 vsldoi8 <1,5,4,6>, <3,4,5,6>
   3779676746U, // <4,6,3,5>: Cost 4 vsldoi8 <3,5,4,6>, <3,5,4,6>
   3398898488U, // <4,6,3,6>: Cost 4 vmrglw <7,2,4,3>, <6,6,6,6>
-  3375009078U, // <4,6,3,7>: Cost 3 vmrglw <3,2,4,3>, RHS
-  3375009079U, // <4,6,3,u>: Cost 3 vmrglw <3,2,4,3>, RHS
+  2301267254U, // <4,6,3,7>: Cost 3 vmrglw <3,2,4,3>, RHS
+  2301267255U, // <4,6,3,u>: Cost 3 vmrglw <3,2,4,3>, RHS
   3852890715U, // <4,6,4,0>: Cost 4 vsldoi12 <4,5,6,4>, <6,4,0,1>
   3315208615U, // <4,6,4,1>: Cost 4 vmrghw <4,4,4,4>, <6,1,7,1>
-  3315208698U, // <4,6,4,2>: Cost 3 vmrghw <4,4,4,4>, <6,2,7,3>
+  2241466874U, // <4,6,4,2>: Cost 3 vmrghw <4,4,4,4>, <6,2,7,3>
   3852890745U, // <4,6,4,3>: Cost 4 vsldoi12 <4,5,6,4>, <6,4,3,4>
-  3315208861U, // <4,6,4,4>: Cost 3 vmrghw <4,4,4,4>, <6,4,7,4>
-  3315290863U, // <4,6,4,5>: Cost 3 vmrghw <4,4,5,5>, <6,5,7,5>
-  3315209016U, // <4,6,4,6>: Cost 3 vmrghw <4,4,4,4>, <6,6,6,6>
-  2308574518U, // <4,6,4,7>: Cost 2 vmrglw <4,4,4,4>, RHS
-  2308574519U, // <4,6,4,u>: Cost 2 vmrglw <4,4,4,4>, RHS
-  3316044065U, // <4,6,5,0>: Cost 3 vmrghw RHS, <6,0,1,2>
-  3316052391U, // <4,6,5,1>: Cost 3 vmrghw RHS, <6,1,7,1>
-  2242310650U, // <4,6,5,2>: Cost 2 vmrghw RHS, <6,2,7,3>
-  3316044338U, // <4,6,5,3>: Cost 3 vmrghw RHS, <6,3,4,5>
-  3316044429U, // <4,6,5,4>: Cost 3 vmrghw RHS, <6,4,5,6>
-  3316052715U, // <4,6,5,5>: Cost 3 vmrghw RHS, <6,5,7,1>
-  2242310968U, // <4,6,5,6>: Cost 2 vmrghw RHS, <6,6,6,6>
-  2295975222U, // <4,6,5,7>: Cost 2 vmrglw <2,3,4,5>, RHS
-  2295975223U, // <4,6,5,u>: Cost 2 vmrglw <2,3,4,5>, RHS
+  2241467037U, // <4,6,4,4>: Cost 3 vmrghw <4,4,4,4>, <6,4,7,4>
+  2241549039U, // <4,6,4,5>: Cost 3 vmrghw <4,4,5,5>, <6,5,7,5>
+  2241467192U, // <4,6,4,6>: Cost 3 vmrghw <4,4,4,4>, <6,6,6,6>
+  1234832694U, // <4,6,4,7>: Cost 2 vmrglw <4,4,4,4>, RHS
+  1234832695U, // <4,6,4,u>: Cost 2 vmrglw <4,4,4,4>, RHS
+  2242302241U, // <4,6,5,0>: Cost 3 vmrghw RHS, <6,0,1,2>
+  2242310567U, // <4,6,5,1>: Cost 3 vmrghw RHS, <6,1,7,1>
+  1168568826U, // <4,6,5,2>: Cost 2 vmrghw RHS, <6,2,7,3>
+  2242302514U, // <4,6,5,3>: Cost 3 vmrghw RHS, <6,3,4,5>
+  2242302605U, // <4,6,5,4>: Cost 3 vmrghw RHS, <6,4,5,6>
+  2242310891U, // <4,6,5,5>: Cost 3 vmrghw RHS, <6,5,7,1>
+  1168569144U, // <4,6,5,6>: Cost 2 vmrghw RHS, <6,6,6,6>
+  1222233398U, // <4,6,5,7>: Cost 2 vmrglw <2,3,4,5>, RHS
+  1222233399U, // <4,6,5,u>: Cost 2 vmrglw <2,3,4,5>, RHS
   3316576545U, // <4,6,6,0>: Cost 4 vmrghw <4,6,5,0>, <6,0,1,2>
   3316584871U, // <4,6,6,1>: Cost 4 vmrghw <4,6,5,1>, <6,1,7,1>
-  3316593146U, // <4,6,6,2>: Cost 3 vmrghw <4,6,5,2>, <6,2,7,3>
+  2242851322U, // <4,6,6,2>: Cost 3 vmrghw <4,6,5,2>, <6,2,7,3>
   3316601394U, // <4,6,6,3>: Cost 4 vmrghw <4,6,5,3>, <6,3,4,5>
   3852890916U, // <4,6,6,4>: Cost 4 vsldoi12 <4,5,6,4>, <6,6,4,4>
   3316617963U, // <4,6,6,5>: Cost 4 vmrghw <4,6,5,5>, <6,5,7,1>
-  3316626232U, // <4,6,6,6>: Cost 3 vmrghw <4,6,5,6>, <6,6,6,6>
-  3859600194U, // <4,6,6,7>: Cost 3 vsldoi12 <5,6,7,4>, <6,6,7,7>
-  3859600203U, // <4,6,6,u>: Cost 3 vsldoi12 <5,6,7,4>, <6,6,u,7>
-  3859600206U, // <4,6,7,0>: Cost 3 vsldoi12 <5,6,7,4>, <6,7,0,1>
+  2242884408U, // <4,6,6,6>: Cost 3 vmrghw <4,6,5,6>, <6,6,6,6>
+  2785858370U, // <4,6,6,7>: Cost 3 vsldoi12 <5,6,7,4>, <6,6,7,7>
+  2785858379U, // <4,6,6,u>: Cost 3 vsldoi12 <5,6,7,4>, <6,6,u,7>
+  2785858382U, // <4,6,7,0>: Cost 3 vsldoi12 <5,6,7,4>, <6,7,0,1>
   3859600215U, // <4,6,7,1>: Cost 4 vsldoi12 <5,6,7,4>, <6,7,1,1>
   3317240314U, // <4,6,7,2>: Cost 4 vmrghw <4,7,5,0>, <6,2,7,3>
-  3865940844U, // <4,6,7,3>: Cost 3 vsldoi12 <6,7,3,4>, <6,7,3,4>
-  3859600246U, // <4,6,7,4>: Cost 3 vsldoi12 <5,6,7,4>, <6,7,4,5>
+  2792199020U, // <4,6,7,3>: Cost 3 vsldoi12 <6,7,3,4>, <6,7,3,4>
+  2785858422U, // <4,6,7,4>: Cost 3 vsldoi12 <5,6,7,4>, <6,7,4,5>
   3856651132U, // <4,6,7,5>: Cost 4 vsldoi12 <5,2,3,4>, <6,7,5,2>
   3317240632U, // <4,6,7,6>: Cost 4 vmrghw <4,7,5,0>, <6,6,6,6>
-  3377696054U, // <4,6,7,7>: Cost 3 vmrglw <3,6,4,7>, RHS
-  3377696055U, // <4,6,7,u>: Cost 3 vmrglw <3,6,4,7>, RHS
-  3318034721U, // <4,6,u,0>: Cost 3 vmrghw RHS, <6,0,1,2>
-  3318034855U, // <4,6,u,1>: Cost 3 vmrghw RHS, <6,1,7,1>
-  2244293114U, // <4,6,u,2>: Cost 2 vmrghw RHS, <6,2,7,3>
-  3318034994U, // <4,6,u,3>: Cost 3 vmrghw RHS, <6,3,4,5>
-  3318035085U, // <4,6,u,4>: Cost 3 vmrghw RHS, <6,4,5,6>
-  3318035179U, // <4,6,u,5>: Cost 3 vmrghw RHS, <6,5,7,1>
-  2244293432U, // <4,6,u,6>: Cost 2 vmrghw RHS, <6,6,6,6>
-  2295999798U, // <4,6,u,7>: Cost 2 vmrglw <2,3,4,u>, RHS
-  2295999799U, // <4,6,u,u>: Cost 2 vmrglw <2,3,4,u>, RHS
-  3312604154U, // <4,7,0,0>: Cost 3 vmrghw <4,0,5,1>, <7,0,1,2>
-  3780345958U, // <4,7,0,1>: Cost 3 vsldoi8 <3,6,4,7>, LHS
+  2303954230U, // <4,6,7,7>: Cost 3 vmrglw <3,6,4,7>, RHS
+  2303954231U, // <4,6,7,u>: Cost 3 vmrglw <3,6,4,7>, RHS
+  2244292897U, // <4,6,u,0>: Cost 3 vmrghw RHS, <6,0,1,2>
+  2244293031U, // <4,6,u,1>: Cost 3 vmrghw RHS, <6,1,7,1>
+  1170551290U, // <4,6,u,2>: Cost 2 vmrghw RHS, <6,2,7,3>
+  2244293170U, // <4,6,u,3>: Cost 3 vmrghw RHS, <6,3,4,5>
+  2244293261U, // <4,6,u,4>: Cost 3 vmrghw RHS, <6,4,5,6>
+  2244293355U, // <4,6,u,5>: Cost 3 vmrghw RHS, <6,5,7,1>
+  1170551608U, // <4,6,u,6>: Cost 2 vmrghw RHS, <6,6,6,6>
+  1222257974U, // <4,6,u,7>: Cost 2 vmrglw <2,3,4,u>, RHS
+  1222257975U, // <4,6,u,u>: Cost 2 vmrglw <2,3,4,u>, RHS
+  2238862330U, // <4,7,0,0>: Cost 3 vmrghw <4,0,5,1>, <7,0,1,2>
+  2706604134U, // <4,7,0,1>: Cost 3 vsldoi8 <3,6,4,7>, LHS
   3312604308U, // <4,7,0,2>: Cost 4 vmrghw <4,0,5,1>, <7,2,0,3>
   3768402176U, // <4,7,0,3>: Cost 4 vsldoi8 <1,6,4,7>, <0,3,1,4>
-  3312604472U, // <4,7,0,4>: Cost 3 vmrghw <4,0,5,1>, <7,4,0,5>
+  2238862648U, // <4,7,0,4>: Cost 3 vmrghw <4,0,5,1>, <7,4,0,5>
   3859600418U, // <4,7,0,5>: Cost 4 vsldoi12 <5,6,7,4>, <7,0,5,6>
   3729994393U, // <4,7,0,6>: Cost 4 vsldoi4 <6,4,7,0>, <6,4,7,0>
-  3312604780U, // <4,7,0,7>: Cost 3 vmrghw <4,0,5,1>, <7,7,7,7>
-  3780346525U, // <4,7,0,u>: Cost 3 vsldoi8 <3,6,4,7>, LHS
+  2238862956U, // <4,7,0,7>: Cost 3 vmrghw <4,0,5,1>, <7,7,7,7>
+  2706604701U, // <4,7,0,u>: Cost 3 vsldoi8 <3,6,4,7>, LHS
   3385610338U, // <4,7,1,0>: Cost 4 vmrglw <5,0,4,1>, <5,6,7,0>
   3780346676U, // <4,7,1,1>: Cost 4 vsldoi8 <3,6,4,7>, <1,1,1,1>
-  3780346778U, // <4,7,1,2>: Cost 3 vsldoi8 <3,6,4,7>, <1,2,3,4>
+  2706604954U, // <4,7,1,2>: Cost 3 vsldoi8 <3,6,4,7>, <1,2,3,4>
   3385610746U, // <4,7,1,3>: Cost 4 vmrglw <5,0,4,1>, <6,2,7,3>
   3385610342U, // <4,7,1,4>: Cost 4 vmrglw <5,0,4,1>, <5,6,7,4>
   3385610667U, // <4,7,1,5>: Cost 4 vmrglw <5,0,4,1>, <6,1,7,5>
   3768403178U, // <4,7,1,6>: Cost 4 vsldoi8 <1,6,4,7>, <1,6,4,7>
   3385611074U, // <4,7,1,7>: Cost 4 vmrglw <5,0,4,1>, <6,6,7,7>
-  3780346778U, // <4,7,1,u>: Cost 3 vsldoi8 <3,6,4,7>, <1,2,3,4>
+  2706604954U, // <4,7,1,u>: Cost 3 vsldoi8 <3,6,4,7>, <1,2,3,4>
   3859600532U, // <4,7,2,0>: Cost 4 vsldoi12 <5,6,7,4>, <7,2,0,3>
   3712091034U, // <4,7,2,1>: Cost 5 vsldoi4 <3,4,7,2>, <1,2,3,4>
   3774375528U, // <4,7,2,2>: Cost 4 vsldoi8 <2,6,4,7>, <2,2,2,2>
-  3868595376U, // <4,7,2,3>: Cost 3 vsldoi12 <7,2,3,4>, <7,2,3,4>
-  3859600568U, // <4,7,2,4>: Cost 3 vsldoi12 <5,6,7,4>, <7,2,4,3>
+  2794853552U, // <4,7,2,3>: Cost 3 vsldoi12 <7,2,3,4>, <7,2,3,4>
+  2785858744U, // <4,7,2,4>: Cost 3 vsldoi12 <5,6,7,4>, <7,2,4,3>
   3735982182U, // <4,7,2,5>: Cost 4 vsldoi4 <7,4,7,2>, <5,6,7,4>
   3774375875U, // <4,7,2,6>: Cost 4 vsldoi8 <2,6,4,7>, <2,6,4,7>
   3735983476U, // <4,7,2,7>: Cost 4 vsldoi4 <7,4,7,2>, <7,4,7,2>
-  3868964061U, // <4,7,2,u>: Cost 3 vsldoi12 <7,2,u,4>, <7,2,u,4>
+  2795222237U, // <4,7,2,u>: Cost 3 vsldoi12 <7,2,u,4>, <7,2,u,4>
   3780348054U, // <4,7,3,0>: Cost 4 vsldoi8 <3,6,4,7>, <3,0,1,2>
   3730015130U, // <4,7,3,1>: Cost 4 vsldoi4 <6,4,7,3>, <1,2,3,4>
   3780348244U, // <4,7,3,2>: Cost 4 vsldoi8 <3,6,4,7>, <3,2,4,3>
   3778357673U, // <4,7,3,3>: Cost 4 vsldoi8 <3,3,4,7>, <3,3,4,7>
-  3398897766U, // <4,7,3,4>: Cost 3 vmrglw <7,2,4,3>, <5,6,7,4>
+  2325155942U, // <4,7,3,4>: Cost 3 vmrglw <7,2,4,3>, <5,6,7,4>
   3779684939U, // <4,7,3,5>: Cost 5 vsldoi8 <3,5,4,7>, <3,5,4,7>
-  3780348572U, // <4,7,3,6>: Cost 3 vsldoi8 <3,6,4,7>, <3,6,4,7>
+  2706606748U, // <4,7,3,6>: Cost 3 vsldoi8 <3,6,4,7>, <3,6,4,7>
   3398898498U, // <4,7,3,7>: Cost 4 vmrglw <7,2,4,3>, <6,6,7,7>
-  3781675838U, // <4,7,3,u>: Cost 3 vsldoi8 <3,u,4,7>, <3,u,4,7>
-  3859600692U, // <4,7,4,0>: Cost 3 vsldoi12 <5,6,7,4>, <7,4,0,1>
+  2707934014U, // <4,7,3,u>: Cost 3 vsldoi8 <3,u,4,7>, <3,u,4,7>
+  2785858868U, // <4,7,4,0>: Cost 3 vsldoi12 <5,6,7,4>, <7,4,0,1>
   3780348874U, // <4,7,4,1>: Cost 4 vsldoi8 <3,6,4,7>, <4,1,2,3>
   3780349000U, // <4,7,4,2>: Cost 4 vsldoi8 <3,6,4,7>, <4,2,7,3>
-  3382317562U, // <4,7,4,3>: Cost 3 vmrglw <4,4,4,4>, <6,2,7,3>
-  3730025680U, // <4,7,4,4>: Cost 3 vsldoi4 <6,4,7,4>, <4,4,4,4>
-  3780349238U, // <4,7,4,5>: Cost 3 vsldoi8 <3,6,4,7>, RHS
-  3730027165U, // <4,7,4,6>: Cost 3 vsldoi4 <6,4,7,4>, <6,4,7,4>
-  3315209836U, // <4,7,4,7>: Cost 3 vmrghw <4,4,4,4>, <7,7,7,7>
-  3780349481U, // <4,7,4,u>: Cost 3 vsldoi8 <3,6,4,7>, RHS
-  2242311162U, // <4,7,5,0>: Cost 2 vmrghw RHS, <7,0,1,2>
-  3316053066U, // <4,7,5,1>: Cost 3 vmrghw RHS, <7,1,1,1>
-  3316045002U, // <4,7,5,2>: Cost 3 vmrghw RHS, <7,2,6,3>
-  3316053219U, // <4,7,5,3>: Cost 3 vmrghw RHS, <7,3,0,1>
-  2242311526U, // <4,7,5,4>: Cost 2 vmrghw RHS, <7,4,5,6>
-  3316053430U, // <4,7,5,5>: Cost 3 vmrghw RHS, <7,5,5,5>
-  3316053486U, // <4,7,5,6>: Cost 3 vmrghw RHS, <7,6,2,7>
-  2242311788U, // <4,7,5,7>: Cost 2 vmrghw RHS, <7,7,7,7>
-  2242311810U, // <4,7,5,u>: Cost 2 vmrghw RHS, <7,u,1,2>
+  2308575738U, // <4,7,4,3>: Cost 3 vmrglw <4,4,4,4>, <6,2,7,3>
+  2656283856U, // <4,7,4,4>: Cost 3 vsldoi4 <6,4,7,4>, <4,4,4,4>
+  2706607414U, // <4,7,4,5>: Cost 3 vsldoi8 <3,6,4,7>, RHS
+  2656285341U, // <4,7,4,6>: Cost 3 vsldoi4 <6,4,7,4>, <6,4,7,4>
+  2241468012U, // <4,7,4,7>: Cost 3 vmrghw <4,4,4,4>, <7,7,7,7>
+  2706607657U, // <4,7,4,u>: Cost 3 vsldoi8 <3,6,4,7>, RHS
+  1168569338U, // <4,7,5,0>: Cost 2 vmrghw RHS, <7,0,1,2>
+  2242311242U, // <4,7,5,1>: Cost 3 vmrghw RHS, <7,1,1,1>
+  2242303178U, // <4,7,5,2>: Cost 3 vmrghw RHS, <7,2,6,3>
+  2242311395U, // <4,7,5,3>: Cost 3 vmrghw RHS, <7,3,0,1>
+  1168569702U, // <4,7,5,4>: Cost 2 vmrghw RHS, <7,4,5,6>
+  2242311606U, // <4,7,5,5>: Cost 3 vmrghw RHS, <7,5,5,5>
+  2242311662U, // <4,7,5,6>: Cost 3 vmrghw RHS, <7,6,2,7>
+  1168569964U, // <4,7,5,7>: Cost 2 vmrghw RHS, <7,7,7,7>
+  1168569986U, // <4,7,5,u>: Cost 2 vmrghw RHS, <7,u,1,2>
   3316593658U, // <4,7,6,0>: Cost 4 vmrghw <4,6,5,2>, <7,0,1,2>
   3316593738U, // <4,7,6,1>: Cost 5 vmrghw <4,6,5,2>, <7,1,1,1>
   3316634800U, // <4,7,6,2>: Cost 4 vmrghw <4,6,5,7>, <7,2,3,4>
   3386978810U, // <4,7,6,3>: Cost 4 vmrglw <5,2,4,6>, <6,2,7,3>
-  3859600896U, // <4,7,6,4>: Cost 3 vsldoi12 <5,6,7,4>, <7,6,4,7>
+  2785859072U, // <4,7,6,4>: Cost 3 vsldoi12 <5,6,7,4>, <7,6,4,7>
   3736014950U, // <4,7,6,5>: Cost 4 vsldoi4 <7,4,7,6>, <5,6,7,4>
   3316594158U, // <4,7,6,6>: Cost 4 vmrghw <4,6,5,2>, <7,6,2,7>
-  3871544856U, // <4,7,6,7>: Cost 3 vsldoi12 <7,6,7,4>, <7,6,7,4>
-  3871618593U, // <4,7,6,u>: Cost 3 vsldoi12 <7,6,u,4>, <7,6,u,4>
-  3317240826U, // <4,7,7,0>: Cost 3 vmrghw <4,7,5,0>, <7,0,1,2>
+  2797803032U, // <4,7,6,7>: Cost 3 vsldoi12 <7,6,7,4>, <7,6,7,4>
+  2797876769U, // <4,7,6,u>: Cost 3 vsldoi12 <7,6,u,4>, <7,6,u,4>
+  2243499002U, // <4,7,7,0>: Cost 3 vmrghw <4,7,5,0>, <7,0,1,2>
   3718103962U, // <4,7,7,1>: Cost 4 vsldoi4 <4,4,7,7>, <1,2,3,4>
   3317257418U, // <4,7,7,2>: Cost 4 vmrghw <4,7,5,2>, <7,2,6,3>
   3377695816U, // <4,7,7,3>: Cost 4 vmrglw <3,6,4,7>, <4,2,7,3>
-  3317273958U, // <4,7,7,4>: Cost 3 vmrghw <4,7,5,4>, <7,4,5,6>
+  2243532134U, // <4,7,7,4>: Cost 3 vmrghw <4,7,5,4>, <7,4,5,6>
   3317282230U, // <4,7,7,5>: Cost 4 vmrghw <4,7,5,5>, <7,5,5,5>
-  3804239360U, // <4,7,7,6>: Cost 3 vsldoi8 <7,6,4,7>, <7,6,4,7>
-  3317298796U, // <4,7,7,7>: Cost 3 vmrghw <4,7,5,7>, <7,7,7,7>
-  3317307010U, // <4,7,7,u>: Cost 3 vmrghw <4,7,5,u>, <7,u,1,2>
-  2244293626U, // <4,7,u,0>: Cost 2 vmrghw RHS, <7,0,1,2>
-  3780351790U, // <4,7,u,1>: Cost 3 vsldoi8 <3,6,4,7>, LHS
-  3318035621U, // <4,7,u,2>: Cost 3 vmrghw RHS, <7,2,2,2>
-  3318035683U, // <4,7,u,3>: Cost 3 vmrghw RHS, <7,3,0,1>
-  2244293990U, // <4,7,u,4>: Cost 2 vmrghw RHS, <7,4,5,6>
-  3780352154U, // <4,7,u,5>: Cost 3 vsldoi8 <3,6,4,7>, RHS
-  3318035950U, // <4,7,u,6>: Cost 3 vmrghw RHS, <7,6,2,7>
-  2244294252U, // <4,7,u,7>: Cost 2 vmrghw RHS, <7,7,7,7>
-  2244294274U, // <4,7,u,u>: Cost 2 vmrghw RHS, <7,u,1,2>
-  2238860178U, // <4,u,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
-  2698649702U, // <4,u,0,1>: Cost 2 vsldoi8 <2,3,4,u>, LHS
-  3712149201U, // <4,u,0,2>: Cost 3 vsldoi4 <3,4,u,0>, <2,3,4,u>
-  3369672860U, // <4,u,0,3>: Cost 3 vmrglw <2,3,4,0>, LHS
-  3761111408U, // <4,u,0,4>: Cost 3 vsldoi8 <0,4,4,u>, <0,4,4,u>
-  2238863514U, // <4,u,0,5>: Cost 2 vmrghw <4,0,5,1>, RHS
-  3736040313U, // <4,u,0,6>: Cost 3 vsldoi4 <7,4,u,0>, <6,7,4,u>
-  3369676104U, // <4,u,0,7>: Cost 3 vmrglw <2,3,4,0>, RHS
-  2698650269U, // <4,u,0,u>: Cost 2 vsldoi8 <2,3,4,u>, LHS
-  3712155750U, // <4,u,1,0>: Cost 3 vsldoi4 <3,4,u,1>, LHS
-  3765093206U, // <4,u,1,1>: Cost 3 vsldoi8 <1,1,4,u>, <1,1,4,u>
-  2759022382U, // <4,u,1,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
-  3361054876U, // <4,u,1,3>: Cost 3 vmrglw <0,u,4,1>, LHS
-  3372999623U, // <4,u,1,4>: Cost 3 vmrglw <2,u,4,1>, <1,2,u,4>
-  3767747738U, // <4,u,1,5>: Cost 3 vsldoi8 <1,5,4,u>, <1,5,4,u>
-  3378973186U, // <4,u,1,6>: Cost 3 vmrglw <3,u,4,1>, <3,4,5,6>
-  3361058120U, // <4,u,1,7>: Cost 3 vmrglw <0,u,4,1>, RHS
-  2759022436U, // <4,u,1,u>: Cost 2 vsldoi12 <1,2,3,4>, LHS
-  3712163942U, // <4,u,2,0>: Cost 3 vsldoi4 <3,4,u,2>, LHS
-  3313948462U, // <4,u,2,1>: Cost 3 vmrghw <4,2,5,3>, LHS
-  3771729536U, // <4,u,2,2>: Cost 3 vsldoi8 <2,2,4,u>, <2,2,4,u>
-  2698651345U, // <4,u,2,3>: Cost 2 vsldoi8 <2,3,4,u>, <2,3,4,u>
-  3833132945U, // <4,u,2,4>: Cost 3 vsldoi12 <1,2,u,4>, <u,2,4,3>
-  3313948826U, // <4,u,2,5>: Cost 3 vmrghw <4,2,5,3>, RHS
-  3772393402U, // <4,u,2,6>: Cost 3 vsldoi8 <2,3,4,u>, <2,6,3,7>
-  3859601324U, // <4,u,2,7>: Cost 3 vsldoi12 <5,6,7,4>, <u,2,7,3>
-  2701969510U, // <4,u,2,u>: Cost 2 vsldoi8 <2,u,4,u>, <2,u,4,u>
-  3832764348U, // <4,u,3,0>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,0,1>
-  3875084232U, // <4,u,3,1>: Cost 3 vsldoi12 <u,3,1,4>, <u,3,1,4>
-  3777702233U, // <4,u,3,2>: Cost 3 vsldoi8 <3,2,4,u>, <3,2,4,u>
-  3832764378U, // <4,u,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,3,4>
-  3832764388U, // <4,u,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,4,5>
-  3314587802U, // <4,u,3,5>: Cost 3 vmrghw <4,3,5,0>, RHS
-  3780356765U, // <4,u,3,6>: Cost 3 vsldoi8 <3,6,4,u>, <3,6,4,u>
-  3375009096U, // <4,u,3,7>: Cost 3 vmrglw <3,2,4,3>, RHS
-  3832764420U, // <4,u,3,u>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,u,1>
-  2644410470U, // <4,u,4,0>: Cost 2 vsldoi4 <4,4,u,4>, LHS
-  2241468206U, // <4,u,4,1>: Cost 2 vmrghw <4,4,4,4>, LHS
-  3772394577U, // <4,u,4,2>: Cost 3 vsldoi8 <2,3,4,u>, <4,2,u,3>
-  2308571292U, // <4,u,4,3>: Cost 2 vmrglw <4,4,4,4>, LHS
-  1302777142U, // <4,u,4,4>: Cost 1 vspltisw0 RHS
-  2698652982U, // <4,u,4,5>: Cost 2 vsldoi8 <2,3,4,u>, RHS
-  3772394905U, // <4,u,4,6>: Cost 3 vsldoi8 <2,3,4,u>, <4,6,u,7>
-  2308574536U, // <4,u,4,7>: Cost 2 vmrglw <4,4,4,4>, RHS
-  1302777142U, // <4,u,4,u>: Cost 1 vspltisw0 RHS
-  2242303699U, // <4,u,5,0>: Cost 2 vmrghw RHS, <u,0,1,2>
-  1168561966U, // <4,u,5,1>: Cost 1 vmrghw RHS, LHS
-  2242303877U, // <4,u,5,2>: Cost 2 vmrghw RHS, <u,2,3,0>
-  2295971996U, // <4,u,5,3>: Cost 2 vmrglw <2,3,4,5>, LHS
-  2242304063U, // <4,u,5,4>: Cost 2 vmrghw RHS, <u,4,5,6>
-  1168562330U, // <4,u,5,5>: Cost 1 vmrghw RHS, RHS
-  2759022746U, // <4,u,5,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
-  2295975240U, // <4,u,5,7>: Cost 2 vmrglw <2,3,4,5>, RHS
-  1168562533U, // <4,u,5,u>: Cost 1 vmrghw RHS, LHS
-  2638454886U, // <4,u,6,0>: Cost 2 vsldoi4 <3,4,u,6>, LHS
-  3700253803U, // <4,u,6,1>: Cost 3 vsldoi4 <1,4,u,6>, <1,4,u,6>
-  3706226500U, // <4,u,6,2>: Cost 3 vsldoi4 <2,4,u,6>, <2,4,u,6>
-  2638457373U, // <4,u,6,3>: Cost 2 vsldoi4 <3,4,u,6>, <3,4,u,6>
-  2638458166U, // <4,u,6,4>: Cost 2 vsldoi4 <3,4,u,6>, RHS
-  3316594842U, // <4,u,6,5>: Cost 3 vmrghw <4,6,5,2>, RHS
-  3730117288U, // <4,u,6,6>: Cost 3 vsldoi4 <6,4,u,6>, <6,4,u,6>
+  2730497536U, // <4,7,7,6>: Cost 3 vsldoi8 <7,6,4,7>, <7,6,4,7>
+  2243556972U, // <4,7,7,7>: Cost 3 vmrghw <4,7,5,7>, <7,7,7,7>
+  2243565186U, // <4,7,7,u>: Cost 3 vmrghw <4,7,5,u>, <7,u,1,2>
+  1170551802U, // <4,7,u,0>: Cost 2 vmrghw RHS, <7,0,1,2>
+  2706609966U, // <4,7,u,1>: Cost 3 vsldoi8 <3,6,4,7>, LHS
+  2244293797U, // <4,7,u,2>: Cost 3 vmrghw RHS, <7,2,2,2>
+  2244293859U, // <4,7,u,3>: Cost 3 vmrghw RHS, <7,3,0,1>
+  1170552166U, // <4,7,u,4>: Cost 2 vmrghw RHS, <7,4,5,6>
+  2706610330U, // <4,7,u,5>: Cost 3 vsldoi8 <3,6,4,7>, RHS
+  2244294126U, // <4,7,u,6>: Cost 3 vmrghw RHS, <7,6,2,7>
+  1170552428U, // <4,7,u,7>: Cost 2 vmrghw RHS, <7,7,7,7>
+  1170552450U, // <4,7,u,u>: Cost 2 vmrghw RHS, <7,u,1,2>
+  1165118354U, // <4,u,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
+  1624907878U, // <4,u,0,1>: Cost 2 vsldoi8 <2,3,4,u>, LHS
+  2638407377U, // <4,u,0,2>: Cost 3 vsldoi4 <3,4,u,0>, <2,3,4,u>
+  2295931036U, // <4,u,0,3>: Cost 3 vmrglw <2,3,4,0>, LHS
+  2687369584U, // <4,u,0,4>: Cost 3 vsldoi8 <0,4,4,u>, <0,4,4,u>
+  1165121690U, // <4,u,0,5>: Cost 2 vmrghw <4,0,5,1>, RHS
+  2662298489U, // <4,u,0,6>: Cost 3 vsldoi4 <7,4,u,0>, <6,7,4,u>
+  2295934280U, // <4,u,0,7>: Cost 3 vmrglw <2,3,4,0>, RHS
+  1624908445U, // <4,u,0,u>: Cost 2 vsldoi8 <2,3,4,u>, LHS
+  2638413926U, // <4,u,1,0>: Cost 3 vsldoi4 <3,4,u,1>, LHS
+  2691351382U, // <4,u,1,1>: Cost 3 vsldoi8 <1,1,4,u>, <1,1,4,u>
+  1685280558U, // <4,u,1,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  2287313052U, // <4,u,1,3>: Cost 3 vmrglw <0,u,4,1>, LHS
+  2299257799U, // <4,u,1,4>: Cost 3 vmrglw <2,u,4,1>, <1,2,u,4>
+  2694005914U, // <4,u,1,5>: Cost 3 vsldoi8 <1,5,4,u>, <1,5,4,u>
+  2305231362U, // <4,u,1,6>: Cost 3 vmrglw <3,u,4,1>, <3,4,5,6>
+  2287316296U, // <4,u,1,7>: Cost 3 vmrglw <0,u,4,1>, RHS
+  1685280612U, // <4,u,1,u>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  2638422118U, // <4,u,2,0>: Cost 3 vsldoi4 <3,4,u,2>, LHS
+  2240206638U, // <4,u,2,1>: Cost 3 vmrghw <4,2,5,3>, LHS
+  2697987712U, // <4,u,2,2>: Cost 3 vsldoi8 <2,2,4,u>, <2,2,4,u>
+  1624909521U, // <4,u,2,3>: Cost 2 vsldoi8 <2,3,4,u>, <2,3,4,u>
+  2759391121U, // <4,u,2,4>: Cost 3 vsldoi12 <1,2,u,4>, <u,2,4,3>
+  2240207002U, // <4,u,2,5>: Cost 3 vmrghw <4,2,5,3>, RHS
+  2698651578U, // <4,u,2,6>: Cost 3 vsldoi8 <2,3,4,u>, <2,6,3,7>
+  2785859500U, // <4,u,2,7>: Cost 3 vsldoi12 <5,6,7,4>, <u,2,7,3>
+  1628227686U, // <4,u,2,u>: Cost 2 vsldoi8 <2,u,4,u>, <2,u,4,u>
+  2759022524U, // <4,u,3,0>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,0,1>
+  2801342408U, // <4,u,3,1>: Cost 3 vsldoi12 <u,3,1,4>, <u,3,1,4>
+  2703960409U, // <4,u,3,2>: Cost 3 vsldoi8 <3,2,4,u>, <3,2,4,u>
+  2759022554U, // <4,u,3,3>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,3,4>
+  2759022564U, // <4,u,3,4>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,4,5>
+  2240845978U, // <4,u,3,5>: Cost 3 vmrghw <4,3,5,0>, RHS
+  2706614941U, // <4,u,3,6>: Cost 3 vsldoi8 <3,6,4,u>, <3,6,4,u>
+  2301267272U, // <4,u,3,7>: Cost 3 vmrglw <3,2,4,3>, RHS
+  2759022596U, // <4,u,3,u>: Cost 3 vsldoi12 <1,2,3,4>, <u,3,u,1>
+  1570668646U, // <4,u,4,0>: Cost 2 vsldoi4 <4,4,u,4>, LHS
+  1167726382U, // <4,u,4,1>: Cost 2 vmrghw <4,4,4,4>, LHS
+  2698652753U, // <4,u,4,2>: Cost 3 vsldoi8 <2,3,4,u>, <4,2,u,3>
+  1234829468U, // <4,u,4,3>: Cost 2 vmrglw <4,4,4,4>, LHS
+  229035318U,  // <4,u,4,4>: Cost 1 vspltisw0 RHS
+  1624911158U, // <4,u,4,5>: Cost 2 vsldoi8 <2,3,4,u>, RHS
+  2698653081U, // <4,u,4,6>: Cost 3 vsldoi8 <2,3,4,u>, <4,6,u,7>
+  1234832712U, // <4,u,4,7>: Cost 2 vmrglw <4,4,4,4>, RHS
+  229035318U,  // <4,u,4,u>: Cost 1 vspltisw0 RHS
+  1168561875U, // <4,u,5,0>: Cost 2 vmrghw RHS, <u,0,1,2>
+  94820142U,   // <4,u,5,1>: Cost 1 vmrghw RHS, LHS
+  1168562053U, // <4,u,5,2>: Cost 2 vmrghw RHS, <u,2,3,0>
+  1222230172U, // <4,u,5,3>: Cost 2 vmrglw <2,3,4,5>, LHS
+  1168562239U, // <4,u,5,4>: Cost 2 vmrghw RHS, <u,4,5,6>
+  94820506U,   // <4,u,5,5>: Cost 1 vmrghw RHS, RHS
+  1685280922U, // <4,u,5,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
+  1222233416U, // <4,u,5,7>: Cost 2 vmrglw <2,3,4,5>, RHS
+  94820709U,   // <4,u,5,u>: Cost 1 vmrghw RHS, LHS
+  1564713062U, // <4,u,6,0>: Cost 2 vsldoi4 <3,4,u,6>, LHS
+  2626511979U, // <4,u,6,1>: Cost 3 vsldoi4 <1,4,u,6>, <1,4,u,6>
+  2632484676U, // <4,u,6,2>: Cost 3 vsldoi4 <2,4,u,6>, <2,4,u,6>
+  1564715549U, // <4,u,6,3>: Cost 2 vsldoi4 <3,4,u,6>, <3,4,u,6>
+  1564716342U, // <4,u,6,4>: Cost 2 vsldoi4 <3,4,u,6>, RHS
+  2242853018U, // <4,u,6,5>: Cost 3 vmrghw <4,6,5,2>, RHS
+  2656375464U, // <4,u,6,6>: Cost 3 vsldoi4 <6,4,u,6>, <6,4,u,6>
   27705344U,   // <4,u,6,7>: Cost 0 copy RHS
   27705344U,   // <4,u,6,u>: Cost 0 copy RHS
-  3859601664U, // <4,u,7,0>: Cost 3 vsldoi12 <5,6,7,4>, <u,7,0,1>
-  3317241646U, // <4,u,7,1>: Cost 3 vmrghw <4,7,5,0>, LHS
-  3801593021U, // <4,u,7,2>: Cost 3 vsldoi8 <7,2,4,u>, <7,2,4,u>
-  3377692828U, // <4,u,7,3>: Cost 3 vmrglw <3,6,4,7>, LHS
-  3859601704U, // <4,u,7,4>: Cost 3 vsldoi12 <5,6,7,4>, <u,7,4,5>
-  3317242010U, // <4,u,7,5>: Cost 3 vmrghw <4,7,5,0>, RHS
-  3804247553U, // <4,u,7,6>: Cost 3 vsldoi8 <7,6,4,u>, <7,6,4,u>
-  3377696072U, // <4,u,7,7>: Cost 3 vmrglw <3,6,4,7>, RHS
-  3377692833U, // <4,u,7,u>: Cost 3 vmrglw <3,6,4,7>, LHS
-  2638471270U, // <4,u,u,0>: Cost 2 vsldoi4 <3,4,u,u>, LHS
-  1170552622U, // <4,u,u,1>: Cost 1 vmrghw RHS, LHS
-  2759022949U, // <4,u,u,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
-  2295996572U, // <4,u,u,3>: Cost 2 vmrglw <2,3,4,u>, LHS
-  1302777142U, // <4,u,u,4>: Cost 1 vspltisw0 RHS
-  1170552986U, // <4,u,u,5>: Cost 1 vmrghw RHS, RHS
-  2759022989U, // <4,u,u,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
+  2785859840U, // <4,u,7,0>: Cost 3 vsldoi12 <5,6,7,4>, <u,7,0,1>
+  2243499822U, // <4,u,7,1>: Cost 3 vmrghw <4,7,5,0>, LHS
+  2727851197U, // <4,u,7,2>: Cost 3 vsldoi8 <7,2,4,u>, <7,2,4,u>
+  2303951004U, // <4,u,7,3>: Cost 3 vmrglw <3,6,4,7>, LHS
+  2785859880U, // <4,u,7,4>: Cost 3 vsldoi12 <5,6,7,4>, <u,7,4,5>
+  2243500186U, // <4,u,7,5>: Cost 3 vmrghw <4,7,5,0>, RHS
+  2730505729U, // <4,u,7,6>: Cost 3 vsldoi8 <7,6,4,u>, <7,6,4,u>
+  2303954248U, // <4,u,7,7>: Cost 3 vmrglw <3,6,4,7>, RHS
+  2303951009U, // <4,u,7,u>: Cost 3 vmrglw <3,6,4,7>, LHS
+  1564729446U, // <4,u,u,0>: Cost 2 vsldoi4 <3,4,u,u>, LHS
+  96810798U,   // <4,u,u,1>: Cost 1 vmrghw RHS, LHS
+  1685281125U, // <4,u,u,2>: Cost 2 vsldoi12 <1,2,3,4>, LHS
+  1222254748U, // <4,u,u,3>: Cost 2 vmrglw <2,3,4,u>, LHS
+  229035318U,  // <4,u,u,4>: Cost 1 vspltisw0 RHS
+  96811162U,   // <4,u,u,5>: Cost 1 vmrghw RHS, RHS
+  1685281165U, // <4,u,u,6>: Cost 2 vsldoi12 <1,2,3,4>, RHS
   27705344U,   // <4,u,u,7>: Cost 0 copy RHS
   27705344U,   // <4,u,u,u>: Cost 0 copy RHS
-  3827974144U, // <5,0,0,0>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,0,0>
-  3827974154U, // <5,0,0,1>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,1,1>
+  2754232320U, // <5,0,0,0>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,0,0>
+  2754232330U, // <5,0,0,1>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,1,1>
   3718194894U, // <5,0,0,2>: Cost 4 vsldoi4 <4,5,0,0>, <2,3,4,5>
   3376385762U, // <5,0,0,3>: Cost 4 vmrglw <3,4,5,0>, <5,2,0,3>
-  3827974181U, // <5,0,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,4,1>
+  2754232357U, // <5,0,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,0,4,1>
   3845816370U, // <5,0,0,5>: Cost 4 vsldoi12 <3,4,0,5>, <0,0,5,5>
   3782353389U, // <5,0,0,6>: Cost 4 vsldoi8 <4,0,5,0>, <0,6,0,7>
   3376386090U, // <5,0,0,7>: Cost 4 vmrglw <3,4,5,0>, <5,6,0,7>
-  3831144521U, // <5,0,0,u>: Cost 3 vsldoi12 <0,u,u,5>, <0,0,u,1>
-  3700285542U, // <5,0,1,0>: Cost 3 vsldoi4 <1,5,0,1>, LHS
-  3700286575U, // <5,0,1,1>: Cost 3 vsldoi4 <1,5,0,1>, <1,5,0,1>
-  2754232422U, // <5,0,1,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  2757402697U, // <5,0,0,u>: Cost 3 vsldoi12 <0,u,u,5>, <0,0,u,1>
+  2626543718U, // <5,0,1,0>: Cost 3 vsldoi4 <1,5,0,1>, LHS
+  2626544751U, // <5,0,1,1>: Cost 3 vsldoi4 <1,5,0,1>, <1,5,0,1>
+  1680490598U, // <5,0,1,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
   3766428665U, // <5,0,1,3>: Cost 4 vsldoi8 <1,3,5,0>, <1,3,5,0>
-  3700288822U, // <5,0,1,4>: Cost 3 vsldoi4 <1,5,0,1>, RHS
-  3724177363U, // <5,0,1,5>: Cost 3 vsldoi4 <5,5,0,1>, <5,5,0,1>
+  2626546998U, // <5,0,1,4>: Cost 3 vsldoi4 <1,5,0,1>, RHS
+  2650435539U, // <5,0,1,5>: Cost 3 vsldoi4 <5,5,0,1>, <5,5,0,1>
   3783017715U, // <5,0,1,6>: Cost 4 vsldoi8 <4,1,5,0>, <1,6,5,7>
   3385019000U, // <5,0,1,7>: Cost 4 vmrglw <4,u,5,1>, <3,6,0,7>
-  2754232476U, // <5,0,1,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  1680490652U, // <5,0,1,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
   3376398336U, // <5,0,2,0>: Cost 4 vmrglw <3,4,5,2>, <0,0,0,0>
-  3319619686U, // <5,0,2,1>: Cost 3 vmrghw <5,2,1,3>, LHS
+  2245877862U, // <5,0,2,1>: Cost 3 vmrghw <5,2,1,3>, LHS
   3773064808U, // <5,0,2,2>: Cost 4 vsldoi8 <2,4,5,0>, <2,2,2,2>
-  3779036878U, // <5,0,2,3>: Cost 3 vsldoi8 <3,4,5,0>, <2,3,4,5>
+  2705295054U, // <5,0,2,3>: Cost 3 vsldoi8 <3,4,5,0>, <2,3,4,5>
   3827974343U, // <5,0,2,4>: Cost 4 vsldoi12 <0,4,1,5>, <0,2,4,1>
   3845816530U, // <5,0,2,5>: Cost 4 vsldoi12 <3,4,0,5>, <0,2,5,3>
   3779037114U, // <5,0,2,6>: Cost 4 vsldoi8 <3,4,5,0>, <2,6,3,7>
   3810887658U, // <5,0,2,7>: Cost 4 vsldoi8 <u,7,5,0>, <2,7,0,1>
-  3319620253U, // <5,0,2,u>: Cost 3 vmrghw <5,2,1,3>, LHS
-  3784345750U, // <5,0,3,0>: Cost 3 vsldoi8 <4,3,5,0>, <3,0,1,2>
+  2245878429U, // <5,0,2,u>: Cost 3 vmrghw <5,2,1,3>, LHS
+  2710603926U, // <5,0,3,0>: Cost 3 vsldoi8 <4,3,5,0>, <3,0,1,2>
   3827974396U, // <5,0,3,1>: Cost 4 vsldoi12 <0,4,1,5>, <0,3,1,0>
   3779037516U, // <5,0,3,2>: Cost 4 vsldoi8 <3,4,5,0>, <3,2,3,4>
   3779037596U, // <5,0,3,3>: Cost 4 vsldoi8 <3,4,5,0>, <3,3,3,3>
-  3779037692U, // <5,0,3,4>: Cost 3 vsldoi8 <3,4,5,0>, <3,4,5,0>
+  2705295868U, // <5,0,3,4>: Cost 3 vsldoi8 <3,4,5,0>, <3,4,5,0>
   3379726804U, // <5,0,3,5>: Cost 4 vmrglw <4,0,5,3>, <3,4,0,5>
   3802925748U, // <5,0,3,6>: Cost 4 vsldoi8 <7,4,5,0>, <3,6,7,4>
   3363138168U, // <5,0,3,7>: Cost 5 vmrglw <1,2,5,3>, <3,6,0,7>
-  3781692224U, // <5,0,3,u>: Cost 3 vsldoi8 <3,u,5,0>, <3,u,5,0>
-  3700310118U, // <5,0,4,0>: Cost 3 vsldoi4 <1,5,0,4>, LHS
-  2754232658U, // <5,0,4,1>: Cost 2 vsldoi12 <0,4,1,5>, <0,4,1,5>
+  2707950400U, // <5,0,3,u>: Cost 3 vsldoi8 <3,u,5,0>, <3,u,5,0>
+  2626568294U, // <5,0,4,0>: Cost 3 vsldoi4 <1,5,0,4>, LHS
+  1680490834U, // <5,0,4,1>: Cost 2 vsldoi12 <0,4,1,5>, <0,4,1,5>
   3828048219U, // <5,0,4,2>: Cost 4 vsldoi12 <0,4,2,5>, <0,4,2,5>
-  3784346756U, // <5,0,4,3>: Cost 3 vsldoi8 <4,3,5,0>, <4,3,5,0>
-  3827974509U, // <5,0,4,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,4,4,5>
-  3779038518U, // <5,0,4,5>: Cost 3 vsldoi8 <3,4,5,0>, RHS
+  2710604932U, // <5,0,4,3>: Cost 3 vsldoi8 <4,3,5,0>, <4,3,5,0>
+  2754232685U, // <5,0,4,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,4,4,5>
+  2705296694U, // <5,0,4,5>: Cost 3 vsldoi8 <3,4,5,0>, RHS
   3779038590U, // <5,0,4,6>: Cost 4 vsldoi8 <3,4,5,0>, <4,6,5,7>
-  3787001288U, // <5,0,4,7>: Cost 3 vsldoi8 <4,7,5,0>, <4,7,5,0>
-  2754232658U, // <5,0,4,u>: Cost 2 vsldoi12 <0,4,1,5>, <0,4,1,5>
-  3385049088U, // <5,0,5,0>: Cost 3 vmrglw <4,u,5,5>, <0,0,0,0>
-  2248179814U, // <5,0,5,1>: Cost 2 vmrghw <5,5,5,5>, LHS
+  2713259464U, // <5,0,4,7>: Cost 3 vsldoi8 <4,7,5,0>, <4,7,5,0>
+  1680490834U, // <5,0,4,u>: Cost 2 vsldoi12 <0,4,1,5>, <0,4,1,5>
+  2311307264U, // <5,0,5,0>: Cost 3 vmrglw <4,u,5,5>, <0,0,0,0>
+  1174437990U, // <5,0,5,1>: Cost 2 vmrghw <5,5,5,5>, LHS
   3779038946U, // <5,0,5,2>: Cost 4 vsldoi8 <3,4,5,0>, <5,2,0,3>
   3845816752U, // <5,0,5,3>: Cost 4 vsldoi12 <3,4,0,5>, <0,5,3,0>
-  3321921874U, // <5,0,5,4>: Cost 3 vmrghw <5,5,5,5>, <0,4,1,5>
-  3321922018U, // <5,0,5,5>: Cost 3 vmrghw <5,5,5,5>, <0,5,u,5>
+  2248180050U, // <5,0,5,4>: Cost 3 vmrghw <5,5,5,5>, <0,4,1,5>
+  2248180194U, // <5,0,5,5>: Cost 3 vmrghw <5,5,5,5>, <0,5,u,5>
   3779039274U, // <5,0,5,6>: Cost 4 vsldoi8 <3,4,5,0>, <5,6,0,7>
   3385051768U, // <5,0,5,7>: Cost 4 vmrglw <4,u,5,5>, <3,6,0,7>
-  2248180381U, // <5,0,5,u>: Cost 2 vmrghw <5,5,5,5>, LHS
-  3376431104U, // <5,0,6,0>: Cost 3 vmrglw <3,4,5,6>, <0,0,0,0>
-  2248949862U, // <5,0,6,1>: Cost 2 vmrghw <5,6,7,0>, LHS
+  1174438557U, // <5,0,5,u>: Cost 2 vmrghw <5,5,5,5>, LHS
+  2302689280U, // <5,0,6,0>: Cost 3 vmrglw <3,4,5,6>, <0,0,0,0>
+  1175208038U, // <5,0,6,1>: Cost 2 vmrghw <5,6,7,0>, LHS
   3787002362U, // <5,0,6,2>: Cost 4 vsldoi8 <4,7,5,0>, <6,2,7,3>
   3376432160U, // <5,0,6,3>: Cost 4 vmrglw <3,4,5,6>, <1,4,0,3>
-  3322691922U, // <5,0,6,4>: Cost 3 vmrghw <5,6,7,0>, <0,4,1,5>
-  3322692004U, // <5,0,6,5>: Cost 3 vmrghw <5,6,7,0>, <0,5,1,6>
+  2248950098U, // <5,0,6,4>: Cost 3 vmrghw <5,6,7,0>, <0,4,1,5>
+  2248950180U, // <5,0,6,5>: Cost 3 vmrghw <5,6,7,0>, <0,5,1,6>
   3376433702U, // <5,0,6,6>: Cost 4 vmrglw <3,4,5,6>, <3,5,0,6>
-  3802927990U, // <5,0,6,7>: Cost 3 vsldoi8 <7,4,5,0>, <6,7,4,5>
-  2248950429U, // <5,0,6,u>: Cost 2 vmrghw <5,6,7,0>, LHS
-  3787002874U, // <5,0,7,0>: Cost 3 vsldoi8 <4,7,5,0>, <7,0,1,2>
+  2729186166U, // <5,0,6,7>: Cost 3 vsldoi8 <7,4,5,0>, <6,7,4,5>
+  1175208605U, // <5,0,6,u>: Cost 2 vmrghw <5,6,7,0>, LHS
+  2713261050U, // <5,0,7,0>: Cost 3 vsldoi8 <4,7,5,0>, <7,0,1,2>
   3365823599U, // <5,0,7,1>: Cost 4 vmrglw <1,6,5,7>, <1,5,0,1>
   3808900317U, // <5,0,7,2>: Cost 4 vsldoi8 <u,4,5,0>, <7,2,u,4>
   3784348899U, // <5,0,7,3>: Cost 4 vsldoi8 <4,3,5,0>, <7,3,0,1>
-  3802928480U, // <5,0,7,4>: Cost 3 vsldoi8 <7,4,5,0>, <7,4,5,0>
+  2729186656U, // <5,0,7,4>: Cost 3 vsldoi8 <7,4,5,0>, <7,4,5,0>
   3787003268U, // <5,0,7,5>: Cost 4 vsldoi8 <4,7,5,0>, <7,5,0,0>
   3802928664U, // <5,0,7,6>: Cost 4 vsldoi8 <7,4,5,0>, <7,6,7,4>
   3787003431U, // <5,0,7,7>: Cost 4 vsldoi8 <4,7,5,0>, <7,7,0,1>
-  3805583012U, // <5,0,7,u>: Cost 3 vsldoi8 <7,u,5,0>, <7,u,5,0>
-  3700342886U, // <5,0,u,0>: Cost 3 vsldoi4 <1,5,0,u>, LHS
-  2756887190U, // <5,0,u,1>: Cost 2 vsldoi12 <0,u,1,5>, <0,u,1,5>
-  2754232989U, // <5,0,u,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
-  3779036878U, // <5,0,u,3>: Cost 3 vsldoi8 <3,4,5,0>, <2,3,4,5>
-  3827974829U, // <5,0,u,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,u,4,1>
-  3779041434U, // <5,0,u,5>: Cost 3 vsldoi8 <3,4,5,0>, RHS
+  2731841188U, // <5,0,7,u>: Cost 3 vsldoi8 <7,u,5,0>, <7,u,5,0>
+  2626601062U, // <5,0,u,0>: Cost 3 vsldoi4 <1,5,0,u>, LHS
+  1683145366U, // <5,0,u,1>: Cost 2 vsldoi12 <0,u,1,5>, <0,u,1,5>
+  1680491165U, // <5,0,u,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  2705295054U, // <5,0,u,3>: Cost 3 vsldoi8 <3,4,5,0>, <2,3,4,5>
+  2754233005U, // <5,0,u,4>: Cost 3 vsldoi12 <0,4,1,5>, <0,u,4,1>
+  2705299610U, // <5,0,u,5>: Cost 3 vsldoi8 <3,4,5,0>, RHS
   3779041488U, // <5,0,u,6>: Cost 4 vsldoi8 <3,4,5,0>, <u,6,3,7>
-  3810892076U, // <5,0,u,7>: Cost 3 vsldoi8 <u,7,5,0>, <u,7,5,0>
-  2754233043U, // <5,0,u,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
-  3787669504U, // <5,1,0,0>: Cost 3 vsldoi8 <4,u,5,1>, <0,0,0,0>
-  2713927782U, // <5,1,0,1>: Cost 2 vsldoi8 <4,u,5,1>, LHS
-  3384349690U, // <5,1,0,2>: Cost 3 vmrglw <4,7,5,0>, <7,0,1,2>
+  2737150252U, // <5,0,u,7>: Cost 3 vsldoi8 <u,7,5,0>, <u,7,5,0>
+  1680491219U, // <5,0,u,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  2713927680U, // <5,1,0,0>: Cost 3 vsldoi8 <4,u,5,1>, <0,0,0,0>
+  1640185958U, // <5,1,0,1>: Cost 2 vsldoi8 <4,u,5,1>, LHS
+  2310607866U, // <5,1,0,2>: Cost 3 vmrglw <4,7,5,0>, <7,0,1,2>
   3787669756U, // <5,1,0,3>: Cost 4 vsldoi8 <4,u,5,1>, <0,3,1,0>
-  3787669842U, // <5,1,0,4>: Cost 3 vsldoi8 <4,u,5,1>, <0,4,1,5>
-  3380363602U, // <5,1,0,5>: Cost 3 vmrglw <4,1,5,0>, <0,4,1,5>
+  2713928018U, // <5,1,0,4>: Cost 3 vsldoi8 <4,u,5,1>, <0,4,1,5>
+  2306621778U, // <5,1,0,5>: Cost 3 vmrglw <4,1,5,0>, <0,4,1,5>
   3787670006U, // <5,1,0,6>: Cost 4 vsldoi8 <4,u,5,1>, <0,6,1,7>
   3736188301U, // <5,1,0,7>: Cost 4 vsldoi4 <7,5,1,0>, <7,5,1,0>
-  2713928349U, // <5,1,0,u>: Cost 2 vsldoi8 <4,u,5,1>, LHS
-  3724247142U, // <5,1,1,0>: Cost 3 vsldoi4 <5,5,1,1>, LHS
-  3827974964U, // <5,1,1,1>: Cost 3 vsldoi12 <0,4,1,5>, <1,1,1,1>
-  3385018518U, // <5,1,1,2>: Cost 3 vmrglw <4,u,5,1>, <3,0,1,2>
-  3385020139U, // <5,1,1,3>: Cost 3 vmrglw <4,u,5,1>, <5,2,1,3>
-  3832177491U, // <5,1,1,4>: Cost 3 vsldoi12 <1,1,4,5>, <1,1,4,5>
-  3827975004U, // <5,1,1,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,1,5,5>
+  1640186525U, // <5,1,0,u>: Cost 2 vsldoi8 <4,u,5,1>, LHS
+  2650505318U, // <5,1,1,0>: Cost 3 vsldoi4 <5,5,1,1>, LHS
+  2754233140U, // <5,1,1,1>: Cost 3 vsldoi12 <0,4,1,5>, <1,1,1,1>
+  2311276694U, // <5,1,1,2>: Cost 3 vmrglw <4,u,5,1>, <3,0,1,2>
+  2311278315U, // <5,1,1,3>: Cost 3 vmrglw <4,u,5,1>, <5,2,1,3>
+  2758435667U, // <5,1,1,4>: Cost 3 vsldoi12 <1,1,4,5>, <1,1,4,5>
+  2754233180U, // <5,1,1,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,1,5,5>
   3385016497U, // <5,1,1,6>: Cost 4 vmrglw <4,u,5,1>, <0,2,1,6>
-  3385020467U, // <5,1,1,7>: Cost 3 vmrglw <4,u,5,1>, <5,6,1,7>
-  3832472439U, // <5,1,1,u>: Cost 3 vsldoi12 <1,1,u,5>, <1,1,u,5>
+  2311278643U, // <5,1,1,7>: Cost 3 vmrglw <4,u,5,1>, <5,6,1,7>
+  2758730615U, // <5,1,1,u>: Cost 3 vsldoi12 <1,1,u,5>, <1,1,u,5>
   3700367462U, // <5,1,2,0>: Cost 4 vsldoi4 <1,5,1,2>, LHS
   3830629255U, // <5,1,2,1>: Cost 4 vsldoi12 <0,u,1,5>, <1,2,1,3>
-  3787671144U, // <5,1,2,2>: Cost 3 vsldoi8 <4,u,5,1>, <2,2,2,2>
-  3827975062U, // <5,1,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,3,0>
-  3832841124U, // <5,1,2,4>: Cost 3 vsldoi12 <1,2,4,5>, <1,2,4,5>
-  3827975083U, // <5,1,2,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,5,3>
-  3787671482U, // <5,1,2,6>: Cost 3 vsldoi8 <4,u,5,1>, <2,6,3,7>
+  2713929320U, // <5,1,2,2>: Cost 3 vsldoi8 <4,u,5,1>, <2,2,2,2>
+  2754233238U, // <5,1,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,3,0>
+  2759099300U, // <5,1,2,4>: Cost 3 vsldoi12 <1,2,4,5>, <1,2,4,5>
+  2754233259U, // <5,1,2,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,5,3>
+  2713929658U, // <5,1,2,6>: Cost 3 vsldoi8 <4,u,5,1>, <2,6,3,7>
   3872359354U, // <5,1,2,7>: Cost 4 vsldoi12 <7,u,0,5>, <1,2,7,0>
-  3827975107U, // <5,1,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,u,0>
-  3787671702U, // <5,1,3,0>: Cost 3 vsldoi8 <4,u,5,1>, <3,0,1,2>
+  2754233283U, // <5,1,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <1,2,u,0>
+  2713929878U, // <5,1,3,0>: Cost 3 vsldoi8 <4,u,5,1>, <3,0,1,2>
   3363135498U, // <5,1,3,1>: Cost 4 vmrglw <1,2,5,3>, <0,0,1,1>
   3363137686U, // <5,1,3,2>: Cost 4 vmrglw <1,2,5,3>, <3,0,1,2>
-  3787671964U, // <5,1,3,3>: Cost 3 vsldoi8 <4,u,5,1>, <3,3,3,3>
-  3787672066U, // <5,1,3,4>: Cost 3 vsldoi8 <4,u,5,1>, <3,4,5,6>
-  3363135826U, // <5,1,3,5>: Cost 3 vmrglw <1,2,5,3>, <0,4,1,5>
+  2713930140U, // <5,1,3,3>: Cost 3 vsldoi8 <4,u,5,1>, <3,3,3,3>
+  2713930242U, // <5,1,3,4>: Cost 3 vsldoi8 <4,u,5,1>, <3,4,5,6>
+  2289394002U, // <5,1,3,5>: Cost 3 vmrglw <1,2,5,3>, <0,4,1,5>
   3787672184U, // <5,1,3,6>: Cost 4 vsldoi8 <4,u,5,1>, <3,6,0,7>
   3787672259U, // <5,1,3,7>: Cost 4 vsldoi8 <4,u,5,1>, <3,7,0,1>
-  3787672350U, // <5,1,3,u>: Cost 3 vsldoi8 <4,u,5,1>, <3,u,1,2>
-  2708622226U, // <5,1,4,0>: Cost 2 vsldoi8 <4,0,5,1>, <4,0,5,1>
-  3833947179U, // <5,1,4,1>: Cost 3 vsldoi12 <1,4,1,5>, <1,4,1,5>
-  3834020916U, // <5,1,4,2>: Cost 3 vsldoi12 <1,4,2,5>, <1,4,2,5>
+  2713930526U, // <5,1,3,u>: Cost 3 vsldoi8 <4,u,5,1>, <3,u,1,2>
+  1634880402U, // <5,1,4,0>: Cost 2 vsldoi8 <4,0,5,1>, <4,0,5,1>
+  2760205355U, // <5,1,4,1>: Cost 3 vsldoi12 <1,4,1,5>, <1,4,1,5>
+  2760279092U, // <5,1,4,2>: Cost 3 vsldoi12 <1,4,2,5>, <1,4,2,5>
   3787672708U, // <5,1,4,3>: Cost 4 vsldoi8 <4,u,5,1>, <4,3,5,0>
-  3787672784U, // <5,1,4,4>: Cost 3 vsldoi8 <4,u,5,1>, <4,4,4,4>
-  2713931062U, // <5,1,4,5>: Cost 2 vsldoi8 <4,u,5,1>, RHS
+  2713930960U, // <5,1,4,4>: Cost 3 vsldoi8 <4,u,5,1>, <4,4,4,4>
+  1640189238U, // <5,1,4,5>: Cost 2 vsldoi8 <4,u,5,1>, RHS
   3786345848U, // <5,1,4,6>: Cost 4 vsldoi8 <4,6,5,1>, <4,6,5,1>
   3787009481U, // <5,1,4,7>: Cost 4 vsldoi8 <4,7,5,1>, <4,7,5,1>
-  2713931290U, // <5,1,4,u>: Cost 2 vsldoi8 <4,u,5,1>, <4,u,5,1>
-  3827975279U, // <5,1,5,0>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,0,1>
-  3787673231U, // <5,1,5,1>: Cost 3 vsldoi8 <4,u,5,1>, <5,1,0,1>
-  3787673323U, // <5,1,5,2>: Cost 3 vsldoi8 <4,u,5,1>, <5,2,1,3>
+  1640189466U, // <5,1,4,u>: Cost 2 vsldoi8 <4,u,5,1>, <4,u,5,1>
+  2754233455U, // <5,1,5,0>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,0,1>
+  2713931407U, // <5,1,5,1>: Cost 3 vsldoi8 <4,u,5,1>, <5,1,0,1>
+  2713931499U, // <5,1,5,2>: Cost 3 vsldoi8 <4,u,5,1>, <5,2,1,3>
   3827975305U, // <5,1,5,3>: Cost 4 vsldoi12 <0,4,1,5>, <1,5,3,0>
-  3827975319U, // <5,1,5,4>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,4,5>
-  3362488658U, // <5,1,5,5>: Cost 3 vmrglw <1,1,5,5>, <0,4,1,5>
-  3787673651U, // <5,1,5,6>: Cost 3 vsldoi8 <4,u,5,1>, <5,6,1,7>
+  2754233495U, // <5,1,5,4>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,4,5>
+  2288746834U, // <5,1,5,5>: Cost 3 vmrglw <1,1,5,5>, <0,4,1,5>
+  2713931827U, // <5,1,5,6>: Cost 3 vsldoi8 <4,u,5,1>, <5,6,1,7>
   3787673725U, // <5,1,5,7>: Cost 4 vsldoi8 <4,u,5,1>, <5,7,1,0>
-  3827975351U, // <5,1,5,u>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,u,1>
-  3742204006U, // <5,1,6,0>: Cost 3 vsldoi4 <u,5,1,6>, LHS
-  3364487826U, // <5,1,6,1>: Cost 3 vmrglw <1,4,5,6>, <0,u,1,1>
-  3376433302U, // <5,1,6,2>: Cost 3 vmrglw <3,4,5,6>, <3,0,1,2>
+  2754233527U, // <5,1,5,u>: Cost 3 vsldoi12 <0,4,1,5>, <1,5,u,1>
+  2668462182U, // <5,1,6,0>: Cost 3 vsldoi4 <u,5,1,6>, LHS
+  2290746002U, // <5,1,6,1>: Cost 3 vmrglw <1,4,5,6>, <0,u,1,1>
+  2302691478U, // <5,1,6,2>: Cost 3 vmrglw <3,4,5,6>, <3,0,1,2>
   3364488071U, // <5,1,6,3>: Cost 4 vmrglw <1,4,5,6>, <1,2,1,3>
-  3376431360U, // <5,1,6,4>: Cost 3 vmrglw <3,4,5,6>, <0,3,1,4>
-  3827975411U, // <5,1,6,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,6,5,7>
-  3787674424U, // <5,1,6,6>: Cost 3 vsldoi8 <4,u,5,1>, <6,6,6,6>
-  3787674446U, // <5,1,6,7>: Cost 3 vsldoi8 <4,u,5,1>, <6,7,0,1>
-  3376431121U, // <5,1,6,u>: Cost 3 vmrglw <3,4,5,6>, <0,0,1,u>
-  3787674618U, // <5,1,7,0>: Cost 3 vsldoi8 <4,u,5,1>, <7,0,1,2>
+  2302689536U, // <5,1,6,4>: Cost 3 vmrglw <3,4,5,6>, <0,3,1,4>
+  2754233587U, // <5,1,6,5>: Cost 3 vsldoi12 <0,4,1,5>, <1,6,5,7>
+  2713932600U, // <5,1,6,6>: Cost 3 vsldoi8 <4,u,5,1>, <6,6,6,6>
+  2713932622U, // <5,1,6,7>: Cost 3 vsldoi8 <4,u,5,1>, <6,7,0,1>
+  2302689297U, // <5,1,6,u>: Cost 3 vmrglw <3,4,5,6>, <0,0,1,u>
+  2713932794U, // <5,1,7,0>: Cost 3 vsldoi8 <4,u,5,1>, <7,0,1,2>
   3365822474U, // <5,1,7,1>: Cost 4 vmrglw <1,6,5,7>, <0,0,1,1>
   3365824662U, // <5,1,7,2>: Cost 4 vmrglw <1,6,5,7>, <3,0,1,2>
   3787674851U, // <5,1,7,3>: Cost 4 vsldoi8 <4,u,5,1>, <7,3,0,1>
-  3787674982U, // <5,1,7,4>: Cost 3 vsldoi8 <4,u,5,1>, <7,4,5,6>
-  3365822802U, // <5,1,7,5>: Cost 3 vmrglw <1,6,5,7>, <0,4,1,5>
+  2713933158U, // <5,1,7,4>: Cost 3 vsldoi8 <4,u,5,1>, <7,4,5,6>
+  2292080978U, // <5,1,7,5>: Cost 3 vmrglw <1,6,5,7>, <0,4,1,5>
   3365823613U, // <5,1,7,6>: Cost 4 vmrglw <1,6,5,7>, <1,5,1,6>
-  3787675244U, // <5,1,7,7>: Cost 3 vsldoi8 <4,u,5,1>, <7,7,7,7>
-  3787675266U, // <5,1,7,u>: Cost 3 vsldoi8 <4,u,5,1>, <7,u,1,2>
-  2732513014U, // <5,1,u,0>: Cost 2 vsldoi8 <u,0,5,1>, <u,0,5,1>
-  2713933614U, // <5,1,u,1>: Cost 2 vsldoi8 <4,u,5,1>, LHS
-  3836675448U, // <5,1,u,2>: Cost 3 vsldoi12 <1,u,2,5>, <1,u,2,5>
-  3827975548U, // <5,1,u,3>: Cost 3 vsldoi12 <0,4,1,5>, <1,u,3,0>
-  3836822922U, // <5,1,u,4>: Cost 3 vsldoi12 <1,u,4,5>, <1,u,4,5>
-  2713933978U, // <5,1,u,5>: Cost 2 vsldoi8 <4,u,5,1>, RHS
-  3787675856U, // <5,1,u,6>: Cost 3 vsldoi8 <4,u,5,1>, <u,6,3,7>
-  3787675904U, // <5,1,u,7>: Cost 3 vsldoi8 <4,u,5,1>, <u,7,0,1>
-  2713934181U, // <5,1,u,u>: Cost 2 vsldoi8 <4,u,5,1>, LHS
+  2713933420U, // <5,1,7,7>: Cost 3 vsldoi8 <4,u,5,1>, <7,7,7,7>
+  2713933442U, // <5,1,7,u>: Cost 3 vsldoi8 <4,u,5,1>, <7,u,1,2>
+  1658771190U, // <5,1,u,0>: Cost 2 vsldoi8 <u,0,5,1>, <u,0,5,1>
+  1640191790U, // <5,1,u,1>: Cost 2 vsldoi8 <4,u,5,1>, LHS
+  2762933624U, // <5,1,u,2>: Cost 3 vsldoi12 <1,u,2,5>, <1,u,2,5>
+  2754233724U, // <5,1,u,3>: Cost 3 vsldoi12 <0,4,1,5>, <1,u,3,0>
+  2763081098U, // <5,1,u,4>: Cost 3 vsldoi12 <1,u,4,5>, <1,u,4,5>
+  1640192154U, // <5,1,u,5>: Cost 2 vsldoi8 <4,u,5,1>, RHS
+  2713934032U, // <5,1,u,6>: Cost 3 vsldoi8 <4,u,5,1>, <u,6,3,7>
+  2713934080U, // <5,1,u,7>: Cost 3 vsldoi8 <4,u,5,1>, <u,7,0,1>
+  1640192357U, // <5,1,u,u>: Cost 2 vsldoi8 <4,u,5,1>, LHS
   3779051520U, // <5,2,0,0>: Cost 4 vsldoi8 <3,4,5,2>, <0,0,0,0>
-  3779051622U, // <5,2,0,1>: Cost 3 vsldoi8 <3,4,5,2>, LHS
+  2705309798U, // <5,2,0,1>: Cost 3 vsldoi8 <3,4,5,2>, LHS
   3838813637U, // <5,2,0,2>: Cost 4 vsldoi12 <2,2,4,5>, <2,0,2,1>
-  3376382054U, // <5,2,0,3>: Cost 3 vmrglw <3,4,5,0>, LHS
+  2302640230U, // <5,2,0,3>: Cost 3 vmrglw <3,4,5,0>, LHS
   3765117266U, // <5,2,0,4>: Cost 4 vsldoi8 <1,1,5,2>, <0,4,1,5>
   3381027892U, // <5,2,0,5>: Cost 4 vmrglw <4,2,5,0>, <1,4,2,5>
   3842794985U, // <5,2,0,6>: Cost 4 vsldoi12 <2,u,4,5>, <2,0,6,1>
   3408232554U, // <5,2,0,7>: Cost 4 vmrglw <u,7,5,0>, <0,1,2,7>
-  3376382059U, // <5,2,0,u>: Cost 3 vmrglw <3,4,5,0>, LHS
+  2302640235U, // <5,2,0,u>: Cost 3 vmrglw <3,4,5,0>, LHS
   3700432998U, // <5,2,1,0>: Cost 4 vsldoi4 <1,5,2,1>, LHS
   3765117785U, // <5,2,1,1>: Cost 4 vsldoi8 <1,1,5,2>, <1,1,5,2>
-  3385017960U, // <5,2,1,2>: Cost 3 vmrglw <4,u,5,1>, <2,2,2,2>
-  2311274598U, // <5,2,1,3>: Cost 2 vmrglw <4,u,5,1>, LHS
+  2311276136U, // <5,2,1,2>: Cost 3 vmrglw <4,u,5,1>, <2,2,2,2>
+  1237532774U, // <5,2,1,3>: Cost 2 vmrglw <4,u,5,1>, LHS
   3700436278U, // <5,2,1,4>: Cost 4 vsldoi4 <1,5,2,1>, RHS
   3381036084U, // <5,2,1,5>: Cost 4 vmrglw <4,2,5,1>, <1,4,2,5>
   3385018045U, // <5,2,1,6>: Cost 4 vmrglw <4,u,5,1>, <2,3,2,6>
   3385017560U, // <5,2,1,7>: Cost 4 vmrglw <4,u,5,1>, <1,6,2,7>
-  2311274603U, // <5,2,1,u>: Cost 2 vmrglw <4,u,5,1>, LHS
+  1237532779U, // <5,2,1,u>: Cost 2 vmrglw <4,u,5,1>, LHS
   3700441190U, // <5,2,2,0>: Cost 4 vsldoi4 <1,5,2,2>, LHS
   3700442242U, // <5,2,2,1>: Cost 4 vsldoi4 <1,5,2,2>, <1,5,2,2>
-  3827975784U, // <5,2,2,2>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,2,2>
-  3827975794U, // <5,2,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,3,3>
-  3838813821U, // <5,2,2,4>: Cost 3 vsldoi12 <2,2,4,5>, <2,2,4,5>
+  2754233960U, // <5,2,2,2>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,2,2>
+  2754233970U, // <5,2,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,3,3>
+  2765071997U, // <5,2,2,4>: Cost 3 vsldoi12 <2,2,4,5>, <2,2,4,5>
   3834021508U, // <5,2,2,5>: Cost 4 vsldoi12 <1,4,2,5>, <2,2,5,3>
   3842795152U, // <5,2,2,6>: Cost 4 vsldoi12 <2,u,4,5>, <2,2,6,6>
   3376402492U, // <5,2,2,7>: Cost 4 vmrglw <3,4,5,2>, <5,6,2,7>
-  3827975839U, // <5,2,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,u,3>
-  3827975846U, // <5,2,3,0>: Cost 3 vsldoi12 <0,4,1,5>, <2,3,0,1>
+  2754234015U, // <5,2,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <2,2,u,3>
+  2754234022U, // <5,2,3,0>: Cost 3 vsldoi12 <0,4,1,5>, <2,3,0,1>
   3827975855U, // <5,2,3,1>: Cost 4 vsldoi12 <0,4,1,5>, <2,3,1,1>
-  3718366926U, // <5,2,3,2>: Cost 3 vsldoi4 <4,5,2,3>, <2,3,4,5>
-  3363135590U, // <5,2,3,3>: Cost 3 vmrglw <1,2,5,3>, LHS
-  2765735630U, // <5,2,3,4>: Cost 2 vsldoi12 <2,3,4,5>, <2,3,4,5>
-  3858794199U, // <5,2,3,5>: Cost 3 vsldoi12 <5,5,5,5>, <2,3,5,5>
+  2644625102U, // <5,2,3,2>: Cost 3 vsldoi4 <4,5,2,3>, <2,3,4,5>
+  2289393766U, // <5,2,3,3>: Cost 3 vmrglw <1,2,5,3>, LHS
+  1691993806U, // <5,2,3,4>: Cost 2 vsldoi12 <2,3,4,5>, <2,3,4,5>
+  2785052375U, // <5,2,3,5>: Cost 3 vsldoi12 <5,5,5,5>, <2,3,5,5>
   3854812897U, // <5,2,3,6>: Cost 4 vsldoi12 <4,u,5,5>, <2,3,6,6>
   3802942187U, // <5,2,3,7>: Cost 4 vsldoi8 <7,4,5,2>, <3,7,4,5>
-  2766030578U, // <5,2,3,u>: Cost 2 vsldoi12 <2,3,u,5>, <2,3,u,5>
+  1692288754U, // <5,2,3,u>: Cost 2 vsldoi12 <2,3,u,5>, <2,3,u,5>
   3839846139U, // <5,2,4,0>: Cost 4 vsldoi12 <2,4,0,5>, <2,4,0,5>
-  3783035876U, // <5,2,4,1>: Cost 3 vsldoi8 <4,1,5,2>, <4,1,5,2>
-  3839993613U, // <5,2,4,2>: Cost 3 vsldoi12 <2,4,2,5>, <2,4,2,5>
-  3839477526U, // <5,2,4,3>: Cost 3 vsldoi12 <2,3,4,5>, <2,4,3,5>
+  2709294052U, // <5,2,4,1>: Cost 3 vsldoi8 <4,1,5,2>, <4,1,5,2>
+  2766251789U, // <5,2,4,2>: Cost 3 vsldoi12 <2,4,2,5>, <2,4,2,5>
+  2765735702U, // <5,2,4,3>: Cost 3 vsldoi12 <2,3,4,5>, <2,4,3,5>
   3840141087U, // <5,2,4,4>: Cost 4 vsldoi12 <2,4,4,5>, <2,4,4,5>
-  3779054902U, // <5,2,4,5>: Cost 3 vsldoi8 <3,4,5,2>, RHS
-  3786354041U, // <5,2,4,6>: Cost 3 vsldoi8 <4,6,5,2>, <4,6,5,2>
+  2705313078U, // <5,2,4,5>: Cost 3 vsldoi8 <3,4,5,2>, RHS
+  2712612217U, // <5,2,4,6>: Cost 3 vsldoi8 <4,6,5,2>, <4,6,5,2>
   3787017674U, // <5,2,4,7>: Cost 4 vsldoi8 <4,7,5,2>, <4,7,5,2>
-  3839477571U, // <5,2,4,u>: Cost 3 vsldoi12 <2,3,4,5>, <2,4,u,5>
+  2765735747U, // <5,2,4,u>: Cost 3 vsldoi12 <2,3,4,5>, <2,4,u,5>
   3834021704U, // <5,2,5,0>: Cost 4 vsldoi12 <1,4,2,5>, <2,5,0,1>
   3834021714U, // <5,2,5,1>: Cost 4 vsldoi12 <1,4,2,5>, <2,5,1,2>
-  3385050728U, // <5,2,5,2>: Cost 3 vmrglw <4,u,5,5>, <2,2,2,2>
-  2311307366U, // <5,2,5,3>: Cost 2 vmrglw <4,u,5,5>, LHS
+  2311308904U, // <5,2,5,2>: Cost 3 vmrglw <4,u,5,5>, <2,2,2,2>
+  1237565542U, // <5,2,5,3>: Cost 2 vmrglw <4,u,5,5>, LHS
   3834021744U, // <5,2,5,4>: Cost 4 vsldoi12 <1,4,2,5>, <2,5,4,5>
   3369124916U, // <5,2,5,5>: Cost 4 vmrglw <2,2,5,5>, <1,4,2,5>
-  3321923514U, // <5,2,5,6>: Cost 3 vmrghw <5,5,5,5>, <2,6,3,7>
+  2248181690U, // <5,2,5,6>: Cost 3 vmrghw <5,5,5,5>, <2,6,3,7>
   3786354825U, // <5,2,5,7>: Cost 4 vsldoi8 <4,6,5,2>, <5,7,2,3>
-  2311307371U, // <5,2,5,u>: Cost 2 vmrglw <4,u,5,5>, LHS
+  1237565547U, // <5,2,5,u>: Cost 2 vmrglw <4,u,5,5>, LHS
   3700473958U, // <5,2,6,0>: Cost 4 vsldoi4 <1,5,2,6>, LHS
   3700475014U, // <5,2,6,1>: Cost 4 vsldoi4 <1,5,2,6>, <1,5,2,6>
-  3370460776U, // <5,2,6,2>: Cost 3 vmrglw <2,4,5,6>, <2,2,2,2>
-  2302689382U, // <5,2,6,3>: Cost 2 vmrglw <3,4,5,6>, LHS
+  2296718952U, // <5,2,6,2>: Cost 3 vmrglw <2,4,5,6>, <2,2,2,2>
+  1228947558U, // <5,2,6,3>: Cost 2 vmrglw <3,4,5,6>, LHS
   3700477238U, // <5,2,6,4>: Cost 4 vsldoi4 <1,5,2,6>, RHS
   3834021836U, // <5,2,6,5>: Cost 4 vsldoi12 <1,4,2,5>, <2,6,5,7>
-  3322693562U, // <5,2,6,6>: Cost 3 vmrghw <5,6,7,0>, <2,6,3,7>
+  2248951738U, // <5,2,6,6>: Cost 3 vmrghw <5,6,7,0>, <2,6,3,7>
   3370461105U, // <5,2,6,7>: Cost 4 vmrglw <2,4,5,6>, <2,6,2,7>
-  2302689387U, // <5,2,6,u>: Cost 2 vmrglw <3,4,5,6>, LHS
+  1228947563U, // <5,2,6,u>: Cost 2 vmrglw <3,4,5,6>, LHS
   3786355706U, // <5,2,7,0>: Cost 4 vsldoi8 <4,6,5,2>, <7,0,1,2>
   3783038037U, // <5,2,7,1>: Cost 4 vsldoi8 <4,1,5,2>, <7,1,2,3>
   3365824104U, // <5,2,7,2>: Cost 4 vmrglw <1,6,5,7>, <2,2,2,2>
-  3365822566U, // <5,2,7,3>: Cost 3 vmrglw <1,6,5,7>, LHS
+  2292080742U, // <5,2,7,3>: Cost 3 vmrglw <1,6,5,7>, LHS
   3842131986U, // <5,2,7,4>: Cost 4 vsldoi12 <2,7,4,5>, <2,7,4,5>
   3371795508U, // <5,2,7,5>: Cost 4 vmrglw <2,6,5,7>, <1,4,2,5>
   3786356206U, // <5,2,7,6>: Cost 4 vsldoi8 <4,6,5,2>, <7,6,2,7>
   3786356332U, // <5,2,7,7>: Cost 4 vsldoi8 <4,6,5,2>, <7,7,7,7>
-  3365822571U, // <5,2,7,u>: Cost 3 vmrglw <1,6,5,7>, LHS
-  3827976251U, // <5,2,u,0>: Cost 3 vsldoi12 <0,4,1,5>, <2,u,0,1>
-  3779057454U, // <5,2,u,1>: Cost 3 vsldoi8 <3,4,5,2>, LHS
-  3370477160U, // <5,2,u,2>: Cost 3 vmrglw <2,4,5,u>, <2,2,2,2>
-  2302705766U, // <5,2,u,3>: Cost 2 vmrglw <3,4,5,u>, LHS
-  2769053795U, // <5,2,u,4>: Cost 2 vsldoi12 <2,u,4,5>, <2,u,4,5>
-  3779057818U, // <5,2,u,5>: Cost 3 vsldoi8 <3,4,5,2>, RHS
-  3842943093U, // <5,2,u,6>: Cost 3 vsldoi12 <2,u,6,5>, <2,u,6,5>
+  2292080747U, // <5,2,7,u>: Cost 3 vmrglw <1,6,5,7>, LHS
+  2754234427U, // <5,2,u,0>: Cost 3 vsldoi12 <0,4,1,5>, <2,u,0,1>
+  2705315630U, // <5,2,u,1>: Cost 3 vsldoi8 <3,4,5,2>, LHS
+  2296735336U, // <5,2,u,2>: Cost 3 vmrglw <2,4,5,u>, <2,2,2,2>
+  1228963942U, // <5,2,u,3>: Cost 2 vmrglw <3,4,5,u>, LHS
+  1695311971U, // <5,2,u,4>: Cost 2 vsldoi12 <2,u,4,5>, <2,u,4,5>
+  2705315994U, // <5,2,u,5>: Cost 3 vsldoi8 <3,4,5,2>, RHS
+  2769201269U, // <5,2,u,6>: Cost 3 vsldoi12 <2,u,6,5>, <2,u,6,5>
   3370477489U, // <5,2,u,7>: Cost 4 vmrglw <2,4,5,u>, <2,6,2,7>
-  2769348743U, // <5,2,u,u>: Cost 2 vsldoi12 <2,u,u,5>, <2,u,u,5>
+  1695606919U, // <5,2,u,u>: Cost 2 vsldoi12 <2,u,u,5>, <2,u,u,5>
   3827976331U, // <5,3,0,0>: Cost 4 vsldoi12 <0,4,1,5>, <3,0,0,0>
-  3827976342U, // <5,3,0,1>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,1,2>
+  2754234518U, // <5,3,0,1>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,1,2>
   3706472290U, // <5,3,0,2>: Cost 4 vsldoi4 <2,5,3,0>, <2,5,3,0>
   3700500630U, // <5,3,0,3>: Cost 4 vsldoi4 <1,5,3,0>, <3,0,1,2>
-  3827976368U, // <5,3,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,4,1>
+  2754234544U, // <5,3,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,4,1>
   3376383766U, // <5,3,0,5>: Cost 4 vmrglw <3,4,5,0>, <2,4,3,5>
   3769770513U, // <5,3,0,6>: Cost 5 vsldoi8 <1,u,5,3>, <0,6,4,7>
   3376383930U, // <5,3,0,7>: Cost 4 vmrglw <3,4,5,0>, <2,6,3,7>
-  3827976405U, // <5,3,0,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,u,2>
-  3385017238U, // <5,3,1,0>: Cost 3 vmrglw <4,u,5,1>, <1,2,3,0>
-  3379709795U, // <5,3,1,1>: Cost 3 vmrglw <4,0,5,1>, <2,5,3,1>
-  3765789611U, // <5,3,1,2>: Cost 3 vsldoi8 <1,2,5,3>, <1,2,5,3>
-  3385017970U, // <5,3,1,3>: Cost 3 vmrglw <4,u,5,1>, <2,2,3,3>
-  3385017242U, // <5,3,1,4>: Cost 3 vmrglw <4,u,5,1>, <1,2,3,4>
+  2754234581U, // <5,3,0,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,0,u,2>
+  2311275414U, // <5,3,1,0>: Cost 3 vmrglw <4,u,5,1>, <1,2,3,0>
+  2305967971U, // <5,3,1,1>: Cost 3 vmrglw <4,0,5,1>, <2,5,3,1>
+  2692047787U, // <5,3,1,2>: Cost 3 vsldoi8 <1,2,5,3>, <1,2,5,3>
+  2311276146U, // <5,3,1,3>: Cost 3 vmrglw <4,u,5,1>, <2,2,3,3>
+  2311275418U, // <5,3,1,4>: Cost 3 vmrglw <4,u,5,1>, <1,2,3,4>
   3765789807U, // <5,3,1,5>: Cost 4 vsldoi8 <1,2,5,3>, <1,5,0,1>
   3765789939U, // <5,3,1,6>: Cost 4 vsldoi8 <1,2,5,3>, <1,6,5,7>
-  3385018298U, // <5,3,1,7>: Cost 3 vmrglw <4,u,5,1>, <2,6,3,7>
-  3769771409U, // <5,3,1,u>: Cost 3 vsldoi8 <1,u,5,3>, <1,u,5,3>
-  3385030533U, // <5,3,2,0>: Cost 3 vmrglw <4,u,5,2>, <u,2,3,0>
+  2311276474U, // <5,3,1,7>: Cost 3 vmrglw <4,u,5,1>, <2,6,3,7>
+  2696029585U, // <5,3,1,u>: Cost 3 vsldoi8 <1,u,5,3>, <1,u,5,3>
+  2311288709U, // <5,3,2,0>: Cost 3 vmrglw <4,u,5,2>, <u,2,3,0>
   3765790243U, // <5,3,2,1>: Cost 4 vsldoi8 <1,2,5,3>, <2,1,3,5>
   3827976513U, // <5,3,2,2>: Cost 4 vsldoi12 <0,4,1,5>, <3,2,2,2>
-  3839478092U, // <5,3,2,3>: Cost 3 vsldoi12 <2,3,4,5>, <3,2,3,4>
-  3319990786U, // <5,3,2,4>: Cost 3 vmrghw <5,2,6,3>, <3,4,5,6>
+  2765736268U, // <5,3,2,3>: Cost 3 vsldoi12 <2,3,4,5>, <3,2,3,4>
+  2246248962U, // <5,3,2,4>: Cost 3 vmrghw <5,2,6,3>, <3,4,5,6>
   3765790563U, // <5,3,2,5>: Cost 4 vsldoi8 <1,2,5,3>, <2,5,3,1>
   3827976550U, // <5,3,2,6>: Cost 4 vsldoi12 <0,4,1,5>, <3,2,6,3>
   3842795887U, // <5,3,2,7>: Cost 4 vsldoi12 <2,u,4,5>, <3,2,7,3>
-  3842795897U, // <5,3,2,u>: Cost 3 vsldoi12 <2,u,4,5>, <3,2,u,4>
+  2769054073U, // <5,3,2,u>: Cost 3 vsldoi12 <2,u,4,5>, <3,2,u,4>
   3827976575U, // <5,3,3,0>: Cost 4 vsldoi12 <0,4,1,5>, <3,3,0,1>
   3765790963U, // <5,3,3,1>: Cost 4 vsldoi8 <1,2,5,3>, <3,1,2,5>
   3839478162U, // <5,3,3,2>: Cost 4 vsldoi12 <2,3,4,5>, <3,3,2,2>
-  3827976604U, // <5,3,3,3>: Cost 3 vsldoi12 <0,4,1,5>, <3,3,3,3>
-  3845450151U, // <5,3,3,4>: Cost 3 vsldoi12 <3,3,4,5>, <3,3,4,5>
+  2754234780U, // <5,3,3,3>: Cost 3 vsldoi12 <0,4,1,5>, <3,3,3,3>
+  2771708327U, // <5,3,3,4>: Cost 3 vsldoi12 <3,3,4,5>, <3,3,4,5>
   3363137059U, // <5,3,3,5>: Cost 4 vmrglw <1,2,5,3>, <2,1,3,5>
   3375081320U, // <5,3,3,6>: Cost 4 vmrglw <3,2,5,3>, <2,5,3,6>
   3363137466U, // <5,3,3,7>: Cost 4 vmrglw <1,2,5,3>, <2,6,3,7>
-  3845745099U, // <5,3,3,u>: Cost 3 vsldoi12 <3,3,u,5>, <3,3,u,5>
-  3845818836U, // <5,3,4,0>: Cost 3 vsldoi12 <3,4,0,5>, <3,4,0,5>
+  2772003275U, // <5,3,3,u>: Cost 3 vsldoi12 <3,3,u,5>, <3,3,u,5>
+  2772077012U, // <5,3,4,0>: Cost 3 vsldoi12 <3,4,0,5>, <3,4,0,5>
   3765791714U, // <5,3,4,1>: Cost 4 vsldoi8 <1,2,5,3>, <4,1,5,0>
-  3783707702U, // <5,3,4,2>: Cost 3 vsldoi8 <4,2,5,3>, <4,2,5,3>
-  3846040047U, // <5,3,4,3>: Cost 3 vsldoi12 <3,4,3,5>, <3,4,3,5>
-  3846113784U, // <5,3,4,4>: Cost 3 vsldoi12 <3,4,4,5>, <3,4,4,5>
-  3827976706U, // <5,3,4,5>: Cost 3 vsldoi12 <0,4,1,5>, <3,4,5,6>
+  2709965878U, // <5,3,4,2>: Cost 3 vsldoi8 <4,2,5,3>, <4,2,5,3>
+  2772298223U, // <5,3,4,3>: Cost 3 vsldoi12 <3,4,3,5>, <3,4,3,5>
+  2772371960U, // <5,3,4,4>: Cost 3 vsldoi12 <3,4,4,5>, <3,4,4,5>
+  2754234882U, // <5,3,4,5>: Cost 3 vsldoi12 <0,4,1,5>, <3,4,5,6>
   3839478282U, // <5,3,4,6>: Cost 4 vsldoi12 <2,3,4,5>, <3,4,6,5>
   3376416698U, // <5,3,4,7>: Cost 4 vmrglw <3,4,5,4>, <2,6,3,7>
-  3827976733U, // <5,3,4,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,4,u,6>
-  3385050006U, // <5,3,5,0>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,0>
+  2754234909U, // <5,3,4,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,4,u,6>
+  2311308182U, // <5,3,5,0>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,0>
   3765792421U, // <5,3,5,1>: Cost 4 vsldoi8 <1,2,5,3>, <5,1,2,5>
-  3789680399U, // <5,3,5,2>: Cost 3 vsldoi8 <5,2,5,3>, <5,2,5,3>
-  3385050738U, // <5,3,5,3>: Cost 3 vmrglw <4,u,5,5>, <2,2,3,3>
-  3385050010U, // <5,3,5,4>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,4>
-  3321924178U, // <5,3,5,5>: Cost 3 vmrghw <5,5,5,5>, <3,5,5,5>
+  2715938575U, // <5,3,5,2>: Cost 3 vsldoi8 <5,2,5,3>, <5,2,5,3>
+  2311308914U, // <5,3,5,3>: Cost 3 vmrglw <4,u,5,5>, <2,2,3,3>
+  2311308186U, // <5,3,5,4>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,4>
+  2248182354U, // <5,3,5,5>: Cost 3 vmrghw <5,5,5,5>, <3,5,5,5>
   3765792837U, // <5,3,5,6>: Cost 4 vsldoi8 <1,2,5,3>, <5,6,3,7>
-  3385051066U, // <5,3,5,7>: Cost 3 vmrglw <4,u,5,5>, <2,6,3,7>
-  3385050014U, // <5,3,5,u>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,u>
-  3706519654U, // <5,3,6,0>: Cost 3 vsldoi4 <2,5,3,6>, LHS
+  2311309242U, // <5,3,5,7>: Cost 3 vmrglw <4,u,5,5>, <2,6,3,7>
+  2311308190U, // <5,3,5,u>: Cost 3 vmrglw <4,u,5,5>, <1,2,3,u>
+  2632777830U, // <5,3,6,0>: Cost 3 vsldoi4 <2,5,3,6>, LHS
   3706520372U, // <5,3,6,1>: Cost 4 vsldoi4 <2,5,3,6>, <1,1,1,1>
-  3706521448U, // <5,3,6,2>: Cost 3 vsldoi4 <2,5,3,6>, <2,5,3,6>
-  3706522114U, // <5,3,6,3>: Cost 3 vsldoi4 <2,5,3,6>, <3,4,5,6>
-  3706522934U, // <5,3,6,4>: Cost 3 vsldoi4 <2,5,3,6>, RHS
-  3322694237U, // <5,3,6,5>: Cost 3 vmrghw <5,6,7,0>, <3,5,6,7>
-  3376433000U, // <5,3,6,6>: Cost 3 vmrglw <3,4,5,6>, <2,5,3,6>
-  3376433082U, // <5,3,6,7>: Cost 3 vmrglw <3,4,5,6>, <2,6,3,7>
-  3706525486U, // <5,3,6,u>: Cost 3 vsldoi4 <2,5,3,6>, LHS
+  2632779624U, // <5,3,6,2>: Cost 3 vsldoi4 <2,5,3,6>, <2,5,3,6>
+  2632780290U, // <5,3,6,3>: Cost 3 vsldoi4 <2,5,3,6>, <3,4,5,6>
+  2632781110U, // <5,3,6,4>: Cost 3 vsldoi4 <2,5,3,6>, RHS
+  2248952413U, // <5,3,6,5>: Cost 3 vmrghw <5,6,7,0>, <3,5,6,7>
+  2302691176U, // <5,3,6,6>: Cost 3 vmrglw <3,4,5,6>, <2,5,3,6>
+  2302691258U, // <5,3,6,7>: Cost 3 vmrglw <3,4,5,6>, <2,6,3,7>
+  2632783662U, // <5,3,6,u>: Cost 3 vsldoi4 <2,5,3,6>, LHS
   3365823382U, // <5,3,7,0>: Cost 4 vmrglw <1,6,5,7>, <1,2,3,0>
   3706529011U, // <5,3,7,1>: Cost 4 vsldoi4 <2,5,3,7>, <1,6,5,7>
   3706529641U, // <5,3,7,2>: Cost 4 vsldoi4 <2,5,3,7>, <2,5,3,7>
   3365824114U, // <5,3,7,3>: Cost 4 vmrglw <1,6,5,7>, <2,2,3,3>
-  3848104683U, // <5,3,7,4>: Cost 3 vsldoi12 <3,7,4,5>, <3,7,4,5>
+  2774362859U, // <5,3,7,4>: Cost 3 vsldoi12 <3,7,4,5>, <3,7,4,5>
   3365824035U, // <5,3,7,5>: Cost 4 vmrglw <1,6,5,7>, <2,1,3,5>
   3383740183U, // <5,3,7,6>: Cost 4 vmrglw <4,6,5,7>, <2,4,3,6>
   3363833786U, // <5,3,7,7>: Cost 4 vmrglw <1,3,5,7>, <2,6,3,7>
-  3848399631U, // <5,3,7,u>: Cost 3 vsldoi12 <3,7,u,5>, <3,7,u,5>
-  3706536038U, // <5,3,u,0>: Cost 3 vsldoi4 <2,5,3,u>, LHS
-  3827976990U, // <5,3,u,1>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,1,2>
-  3706537834U, // <5,3,u,2>: Cost 3 vsldoi4 <2,5,3,u>, <2,5,3,u>
-  3706538500U, // <5,3,u,3>: Cost 3 vsldoi4 <2,5,3,u>, <3,4,5,u>
-  3706539318U, // <5,3,u,4>: Cost 3 vsldoi4 <2,5,3,u>, RHS
-  3827977030U, // <5,3,u,5>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,5,6>
-  3376433000U, // <5,3,u,6>: Cost 3 vmrglw <3,4,5,6>, <2,5,3,6>
-  3376449466U, // <5,3,u,7>: Cost 3 vmrglw <3,4,5,u>, <2,6,3,7>
-  3827977053U, // <5,3,u,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,u,2>
+  2774657807U, // <5,3,7,u>: Cost 3 vsldoi12 <3,7,u,5>, <3,7,u,5>
+  2632794214U, // <5,3,u,0>: Cost 3 vsldoi4 <2,5,3,u>, LHS
+  2754235166U, // <5,3,u,1>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,1,2>
+  2632796010U, // <5,3,u,2>: Cost 3 vsldoi4 <2,5,3,u>, <2,5,3,u>
+  2632796676U, // <5,3,u,3>: Cost 3 vsldoi4 <2,5,3,u>, <3,4,5,u>
+  2632797494U, // <5,3,u,4>: Cost 3 vsldoi4 <2,5,3,u>, RHS
+  2754235206U, // <5,3,u,5>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,5,6>
+  2302691176U, // <5,3,u,6>: Cost 3 vmrglw <3,4,5,6>, <2,5,3,6>
+  2302707642U, // <5,3,u,7>: Cost 3 vmrglw <3,4,5,u>, <2,6,3,7>
+  2754235229U, // <5,3,u,u>: Cost 3 vsldoi12 <0,4,1,5>, <3,u,u,2>
   3765133325U, // <5,4,0,0>: Cost 4 vsldoi8 <1,1,5,4>, <0,0,1,4>
-  3779068006U, // <5,4,0,1>: Cost 3 vsldoi8 <3,4,5,4>, LHS
+  2705326182U, // <5,4,0,1>: Cost 3 vsldoi8 <3,4,5,4>, LHS
   3718489806U, // <5,4,0,2>: Cost 4 vsldoi4 <4,5,4,0>, <2,3,4,5>
   3718490624U, // <5,4,0,3>: Cost 4 vsldoi4 <4,5,4,0>, <3,4,5,4>
-  3783049554U, // <5,4,0,4>: Cost 3 vsldoi8 <4,1,5,4>, <0,4,1,5>
-  3376383694U, // <5,4,0,5>: Cost 3 vmrglw <3,4,5,0>, <2,3,4,5>
+  2709307730U, // <5,4,0,4>: Cost 3 vsldoi8 <4,1,5,4>, <0,4,1,5>
+  2302641870U, // <5,4,0,5>: Cost 3 vmrglw <3,4,5,0>, <2,3,4,5>
   3376383695U, // <5,4,0,6>: Cost 5 vmrglw <3,4,5,0>, <2,3,4,6>
   3384351018U, // <5,4,0,7>: Cost 4 vmrglw <4,7,5,0>, <u,7,4,7>
-  3779068573U, // <5,4,0,u>: Cost 3 vsldoi8 <3,4,5,4>, LHS
-  3379712881U, // <5,4,1,0>: Cost 3 vmrglw <4,0,5,1>, <6,7,4,0>
+  2705326749U, // <5,4,0,u>: Cost 3 vsldoi8 <3,4,5,4>, LHS
+  2305971057U, // <5,4,1,0>: Cost 3 vmrglw <4,0,5,1>, <6,7,4,0>
   3765134171U, // <5,4,1,1>: Cost 4 vsldoi8 <1,1,5,4>, <1,1,5,4>
   3766461338U, // <5,4,1,2>: Cost 4 vsldoi8 <1,3,5,4>, <1,2,3,4>
   3766461437U, // <5,4,1,3>: Cost 4 vsldoi8 <1,3,5,4>, <1,3,5,4>
-  3385019600U, // <5,4,1,4>: Cost 3 vmrglw <4,u,5,1>, <4,4,4,4>
-  3827977186U, // <5,4,1,5>: Cost 3 vsldoi12 <0,4,1,5>, <4,1,5,0>
+  2311277776U, // <5,4,1,4>: Cost 3 vmrglw <4,u,5,1>, <4,4,4,4>
+  2754235362U, // <5,4,1,5>: Cost 3 vsldoi12 <0,4,1,5>, <4,1,5,0>
   3783050483U, // <5,4,1,6>: Cost 4 vsldoi8 <4,1,5,4>, <1,6,5,7>
   3385019036U, // <5,4,1,7>: Cost 4 vmrglw <4,u,5,1>, <3,6,4,7>
-  3385018065U, // <5,4,1,u>: Cost 3 vmrglw <4,u,5,1>, <2,3,4,u>
+  2311276241U, // <5,4,1,u>: Cost 3 vmrglw <4,u,5,1>, <2,3,4,u>
   3718504550U, // <5,4,2,0>: Cost 4 vsldoi4 <4,5,4,2>, LHS
   3783050787U, // <5,4,2,1>: Cost 4 vsldoi8 <4,1,5,4>, <2,1,3,5>
   3773097576U, // <5,4,2,2>: Cost 4 vsldoi8 <2,4,5,4>, <2,2,2,2>
-  3779069646U, // <5,4,2,3>: Cost 3 vsldoi8 <3,4,5,4>, <2,3,4,5>
+  2705327822U, // <5,4,2,3>: Cost 3 vsldoi8 <3,4,5,4>, <2,3,4,5>
   3773097767U, // <5,4,2,4>: Cost 4 vsldoi8 <2,4,5,4>, <2,4,5,4>
-  3839478838U, // <5,4,2,5>: Cost 3 vsldoi12 <2,3,4,5>, <4,2,5,3>
+  2765737014U, // <5,4,2,5>: Cost 3 vsldoi12 <2,3,4,5>, <4,2,5,3>
   3779069882U, // <5,4,2,6>: Cost 4 vsldoi8 <3,4,5,4>, <2,6,3,7>
   3376401052U, // <5,4,2,7>: Cost 5 vmrglw <3,4,5,2>, <3,6,4,7>
-  3319623194U, // <5,4,2,u>: Cost 3 vmrghw <5,2,1,3>, <4,u,5,1>
+  2245881370U, // <5,4,2,u>: Cost 3 vmrghw <5,2,1,3>, <4,u,5,1>
   3779070102U, // <5,4,3,0>: Cost 4 vsldoi8 <3,4,5,4>, <3,0,1,2>
   3363135525U, // <5,4,3,1>: Cost 4 vmrglw <1,2,5,3>, <0,0,4,1>
   3779070284U, // <5,4,3,2>: Cost 4 vsldoi8 <3,4,5,4>, <3,2,3,4>
   3779070364U, // <5,4,3,3>: Cost 4 vsldoi8 <3,4,5,4>, <3,3,3,3>
-  3779070464U, // <5,4,3,4>: Cost 3 vsldoi8 <3,4,5,4>, <3,4,5,4>
-  3381053134U, // <5,4,3,5>: Cost 3 vmrglw <4,2,5,3>, <2,3,4,5>
+  2705328640U, // <5,4,3,4>: Cost 3 vsldoi8 <3,4,5,4>, <3,4,5,4>
+  2307311310U, // <5,4,3,5>: Cost 3 vmrglw <4,2,5,3>, <2,3,4,5>
   3866021012U, // <5,4,3,6>: Cost 4 vsldoi12 <6,7,4,5>, <4,3,6,7>
   3363138204U, // <5,4,3,7>: Cost 5 vmrglw <1,2,5,3>, <3,6,4,7>
-  3781724996U, // <5,4,3,u>: Cost 3 vsldoi8 <3,u,5,4>, <3,u,5,4>
-  3782388629U, // <5,4,4,0>: Cost 3 vsldoi8 <4,0,5,4>, <4,0,5,4>
-  3783052262U, // <5,4,4,1>: Cost 3 vsldoi8 <4,1,5,4>, <4,1,5,4>
+  2707983172U, // <5,4,3,u>: Cost 3 vsldoi8 <3,u,5,4>, <3,u,5,4>
+  2708646805U, // <5,4,4,0>: Cost 3 vsldoi8 <4,0,5,4>, <4,0,5,4>
+  2709310438U, // <5,4,4,1>: Cost 3 vsldoi8 <4,1,5,4>, <4,1,5,4>
   3779071030U, // <5,4,4,2>: Cost 4 vsldoi8 <3,4,5,4>, <4,2,5,3>
-  3784379528U, // <5,4,4,3>: Cost 3 vsldoi8 <4,3,5,4>, <4,3,5,4>
-  3827977424U, // <5,4,4,4>: Cost 3 vsldoi12 <0,4,1,5>, <4,4,4,4>
-  2778418394U, // <5,4,4,5>: Cost 2 vsldoi12 <4,4,5,5>, <4,4,5,5>
+  2710637704U, // <5,4,4,3>: Cost 3 vsldoi8 <4,3,5,4>, <4,3,5,4>
+  2754235600U, // <5,4,4,4>: Cost 3 vsldoi12 <0,4,1,5>, <4,4,4,4>
+  1704676570U, // <5,4,4,5>: Cost 2 vsldoi12 <4,4,5,5>, <4,4,5,5>
   3779071358U, // <5,4,4,6>: Cost 4 vsldoi8 <3,4,5,4>, <4,6,5,7>
-  3787034060U, // <5,4,4,7>: Cost 3 vsldoi8 <4,7,5,4>, <4,7,5,4>
-  2778639605U, // <5,4,4,u>: Cost 2 vsldoi12 <4,4,u,5>, <4,4,u,5>
-  3700613222U, // <5,4,5,0>: Cost 3 vsldoi4 <1,5,4,5>, LHS
-  3700614295U, // <5,4,5,1>: Cost 3 vsldoi4 <1,5,4,5>, <1,5,4,5>
-  3839479054U, // <5,4,5,2>: Cost 3 vsldoi12 <2,3,4,5>, <4,5,2,3>
+  2713292236U, // <5,4,4,7>: Cost 3 vsldoi8 <4,7,5,4>, <4,7,5,4>
+  1704897781U, // <5,4,4,u>: Cost 2 vsldoi12 <4,4,u,5>, <4,4,u,5>
+  2626871398U, // <5,4,5,0>: Cost 3 vsldoi4 <1,5,4,5>, LHS
+  2626872471U, // <5,4,5,1>: Cost 3 vsldoi4 <1,5,4,5>, <1,5,4,5>
+  2765737230U, // <5,4,5,2>: Cost 3 vsldoi12 <2,3,4,5>, <4,5,2,3>
   3700615318U, // <5,4,5,3>: Cost 4 vsldoi4 <1,5,4,5>, <3,0,1,2>
-  3700616502U, // <5,4,5,4>: Cost 3 vsldoi4 <1,5,4,5>, RHS
-  2248183094U, // <5,4,5,5>: Cost 2 vmrghw <5,5,5,5>, RHS
-  2754235702U, // <5,4,5,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  2626874678U, // <5,4,5,4>: Cost 3 vsldoi4 <1,5,4,5>, RHS
+  1174441270U, // <5,4,5,5>: Cost 2 vmrghw <5,5,5,5>, RHS
+  1680493878U, // <5,4,5,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
   3385051804U, // <5,4,5,7>: Cost 4 vmrglw <4,u,5,5>, <3,6,4,7>
-  2754235720U, // <5,4,5,u>: Cost 2 vsldoi12 <0,4,1,5>, RHS
-  3322694546U, // <5,4,6,0>: Cost 3 vmrghw <5,6,7,0>, <4,0,5,1>
-  3376433976U, // <5,4,6,1>: Cost 3 vmrglw <3,4,5,6>, <3,u,4,1>
+  1680493896U, // <5,4,5,u>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  2248952722U, // <5,4,6,0>: Cost 3 vmrghw <5,6,7,0>, <4,0,5,1>
+  2302692152U, // <5,4,6,1>: Cost 3 vmrglw <3,4,5,6>, <3,u,4,1>
   3382406107U, // <5,4,6,2>: Cost 4 vmrglw <4,4,5,6>, <4,1,4,2>
   3700623874U, // <5,4,6,3>: Cost 4 vsldoi4 <1,5,4,6>, <3,4,5,6>
-  3322694864U, // <5,4,6,4>: Cost 3 vmrghw <5,6,7,0>, <4,4,4,4>
-  2248953142U, // <5,4,6,5>: Cost 2 vmrghw <5,6,7,0>, RHS
+  2248953040U, // <5,4,6,4>: Cost 3 vmrghw <5,6,7,0>, <4,4,4,4>
+  1175211318U, // <5,4,6,5>: Cost 2 vmrghw <5,6,7,0>, RHS
   3376432280U, // <5,4,6,6>: Cost 4 vmrglw <3,4,5,6>, <1,5,4,6>
-  3802960758U, // <5,4,6,7>: Cost 3 vsldoi8 <7,4,5,4>, <6,7,4,5>
-  2248953385U, // <5,4,6,u>: Cost 2 vmrghw <5,6,7,0>, RHS
+  2729218934U, // <5,4,6,7>: Cost 3 vsldoi8 <7,4,5,4>, <6,7,4,5>
+  1175211561U, // <5,4,6,u>: Cost 2 vmrghw <5,6,7,0>, RHS
   3787035642U, // <5,4,7,0>: Cost 4 vsldoi8 <4,7,5,4>, <7,0,1,2>
   3365822501U, // <5,4,7,1>: Cost 4 vmrglw <1,6,5,7>, <0,0,4,1>
   3808933085U, // <5,4,7,2>: Cost 4 vsldoi8 <u,4,5,4>, <7,2,u,4>
   3784381707U, // <5,4,7,3>: Cost 4 vsldoi8 <4,3,5,4>, <7,3,4,5>
-  3787036006U, // <5,4,7,4>: Cost 3 vsldoi8 <4,7,5,4>, <7,4,5,6>
-  3383740110U, // <5,4,7,5>: Cost 3 vmrglw <4,6,5,7>, <2,3,4,5>
+  2713294182U, // <5,4,7,4>: Cost 3 vsldoi8 <4,7,5,4>, <7,4,5,6>
+  2309998286U, // <5,4,7,5>: Cost 3 vmrglw <4,6,5,7>, <2,3,4,5>
   3383740111U, // <5,4,7,6>: Cost 4 vmrglw <4,6,5,7>, <2,3,4,6>
   3787036239U, // <5,4,7,7>: Cost 4 vsldoi8 <4,7,5,4>, <7,7,4,5>
-  3805615784U, // <5,4,7,u>: Cost 3 vsldoi8 <7,u,5,4>, <7,u,5,4>
-  3700637798U, // <5,4,u,0>: Cost 3 vsldoi4 <1,5,4,u>, LHS
-  3700638874U, // <5,4,u,1>: Cost 3 vsldoi4 <1,5,4,u>, <1,5,4,u>
-  3718555342U, // <5,4,u,2>: Cost 3 vsldoi4 <4,5,4,u>, <2,3,4,5>
-  3779069646U, // <5,4,u,3>: Cost 3 vsldoi8 <3,4,5,4>, <2,3,4,5>
-  3700641078U, // <5,4,u,4>: Cost 3 vsldoi4 <1,5,4,u>, RHS
-  2781072926U, // <5,4,u,5>: Cost 2 vsldoi12 <4,u,5,5>, <4,u,5,5>
-  2754235945U, // <5,4,u,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
-  3810924848U, // <5,4,u,7>: Cost 3 vsldoi8 <u,7,5,4>, <u,7,5,4>
-  2754235963U, // <5,4,u,u>: Cost 2 vsldoi12 <0,4,1,5>, RHS
-  3376384508U, // <5,5,0,0>: Cost 3 vmrglw <3,4,5,0>, <3,4,5,0>
-  2713960550U, // <5,5,0,1>: Cost 2 vsldoi8 <4,u,5,5>, LHS
+  2731873960U, // <5,4,7,u>: Cost 3 vsldoi8 <7,u,5,4>, <7,u,5,4>
+  2626895974U, // <5,4,u,0>: Cost 3 vsldoi4 <1,5,4,u>, LHS
+  2626897050U, // <5,4,u,1>: Cost 3 vsldoi4 <1,5,4,u>, <1,5,4,u>
+  2644813518U, // <5,4,u,2>: Cost 3 vsldoi4 <4,5,4,u>, <2,3,4,5>
+  2705327822U, // <5,4,u,3>: Cost 3 vsldoi8 <3,4,5,4>, <2,3,4,5>
+  2626899254U, // <5,4,u,4>: Cost 3 vsldoi4 <1,5,4,u>, RHS
+  1707331102U, // <5,4,u,5>: Cost 2 vsldoi12 <4,u,5,5>, <4,u,5,5>
+  1680494121U, // <5,4,u,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  2737183024U, // <5,4,u,7>: Cost 3 vsldoi8 <u,7,5,4>, <u,7,5,4>
+  1680494139U, // <5,4,u,u>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  2302642684U, // <5,5,0,0>: Cost 3 vmrglw <3,4,5,0>, <3,4,5,0>
+  1640218726U, // <5,5,0,1>: Cost 2 vsldoi8 <4,u,5,5>, LHS
   3376384510U, // <5,5,0,2>: Cost 4 vmrglw <3,4,5,0>, <3,4,5,2>
   3376385078U, // <5,5,0,3>: Cost 4 vmrglw <3,4,5,0>, <4,2,5,3>
-  3827977826U, // <5,5,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <5,0,4,1>
-  3791684066U, // <5,5,0,5>: Cost 3 vsldoi8 <5,5,5,5>, <0,5,u,5>
-  3318648930U, // <5,5,0,6>: Cost 3 vmrghw <5,0,6,1>, <5,6,7,0>
+  2754236002U, // <5,5,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <5,0,4,1>
+  2717942242U, // <5,5,0,5>: Cost 3 vsldoi8 <5,5,5,5>, <0,5,u,5>
+  2244907106U, // <5,5,0,6>: Cost 3 vmrghw <5,0,6,1>, <5,6,7,0>
   3376385406U, // <5,5,0,7>: Cost 4 vmrglw <3,4,5,0>, <4,6,5,7>
-  2713961117U, // <5,5,0,u>: Cost 2 vsldoi8 <4,u,5,5>, LHS
-  3379711189U, // <5,5,1,0>: Cost 3 vmrglw <4,0,5,1>, <4,4,5,0>
-  2311278106U, // <5,5,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
-  3787703190U, // <5,5,1,2>: Cost 3 vsldoi8 <4,u,5,5>, <1,2,3,0>
+  1640219293U, // <5,5,0,u>: Cost 2 vsldoi8 <4,u,5,5>, LHS
+  2305969365U, // <5,5,1,0>: Cost 3 vmrglw <4,0,5,1>, <4,4,5,0>
+  1237536282U, // <5,5,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
+  2713961366U, // <5,5,1,2>: Cost 3 vsldoi8 <4,u,5,5>, <1,2,3,0>
   3766469630U, // <5,5,1,3>: Cost 4 vsldoi8 <1,3,5,5>, <1,3,5,5>
-  3856068279U, // <5,5,1,4>: Cost 3 vsldoi12 <5,1,4,5>, <5,1,4,5>
-  3385019610U, // <5,5,1,5>: Cost 3 vmrglw <4,u,5,1>, <4,4,5,5>
-  3385018882U, // <5,5,1,6>: Cost 3 vmrglw <4,u,5,1>, <3,4,5,6>
+  2782326455U, // <5,5,1,4>: Cost 3 vsldoi12 <5,1,4,5>, <5,1,4,5>
+  2311277786U, // <5,5,1,5>: Cost 3 vmrglw <4,u,5,1>, <4,4,5,5>
+  2311277058U, // <5,5,1,6>: Cost 3 vmrglw <4,u,5,1>, <3,4,5,6>
   3385017587U, // <5,5,1,7>: Cost 4 vmrglw <4,u,5,1>, <1,6,5,7>
-  2311278106U, // <5,5,1,u>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
+  1237536282U, // <5,5,1,u>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
   3376400892U, // <5,5,2,0>: Cost 4 vmrglw <3,4,5,2>, <3,4,5,0>
   3827977963U, // <5,5,2,1>: Cost 4 vsldoi12 <0,4,1,5>, <5,2,1,3>
-  3376400894U, // <5,5,2,2>: Cost 3 vmrglw <3,4,5,2>, <3,4,5,2>
-  3839479550U, // <5,5,2,3>: Cost 3 vsldoi12 <2,3,4,5>, <5,2,3,4>
+  2302659070U, // <5,5,2,2>: Cost 3 vmrglw <3,4,5,2>, <3,4,5,2>
+  2765737726U, // <5,5,2,3>: Cost 3 vsldoi12 <2,3,4,5>, <5,2,3,4>
   3839479558U, // <5,5,2,4>: Cost 4 vsldoi12 <2,3,4,5>, <5,2,4,3>
-  3854814991U, // <5,5,2,5>: Cost 3 vsldoi12 <4,u,5,5>, <5,2,5,3>
-  3787704250U, // <5,5,2,6>: Cost 3 vsldoi8 <4,u,5,5>, <2,6,3,7>
+  2781073167U, // <5,5,2,5>: Cost 3 vsldoi12 <4,u,5,5>, <5,2,5,3>
+  2713962426U, // <5,5,2,6>: Cost 3 vsldoi8 <4,u,5,5>, <2,6,3,7>
   3376401790U, // <5,5,2,7>: Cost 4 vmrglw <3,4,5,2>, <4,6,5,7>
-  3842797355U, // <5,5,2,u>: Cost 3 vsldoi12 <2,u,4,5>, <5,2,u,4>
-  3787704470U, // <5,5,3,0>: Cost 3 vsldoi8 <4,u,5,5>, <3,0,1,2>
+  2769055531U, // <5,5,2,u>: Cost 3 vsldoi12 <2,u,4,5>, <5,2,u,4>
+  2713962646U, // <5,5,3,0>: Cost 3 vsldoi8 <4,u,5,5>, <3,0,1,2>
   3765143786U, // <5,5,3,1>: Cost 4 vsldoi8 <1,1,5,5>, <3,1,1,5>
   3839479621U, // <5,5,3,2>: Cost 4 vsldoi12 <2,3,4,5>, <5,3,2,3>
-  3363136427U, // <5,5,3,3>: Cost 3 vmrglw <1,2,5,3>, <1,2,5,3>
-  3787704834U, // <5,5,3,4>: Cost 3 vsldoi8 <4,u,5,5>, <3,4,5,6>
-  3387026974U, // <5,5,3,5>: Cost 3 vmrglw <5,2,5,3>, <4,u,5,5>
+  2289394603U, // <5,5,3,3>: Cost 3 vmrglw <1,2,5,3>, <1,2,5,3>
+  2713963010U, // <5,5,3,4>: Cost 3 vsldoi8 <4,u,5,5>, <3,4,5,6>
+  2313285150U, // <5,5,3,5>: Cost 3 vmrglw <5,2,5,3>, <4,u,5,5>
   3363138050U, // <5,5,3,6>: Cost 4 vmrglw <1,2,5,3>, <3,4,5,6>
   3363136755U, // <5,5,3,7>: Cost 4 vmrglw <1,2,5,3>, <1,6,5,7>
-  3787705118U, // <5,5,3,u>: Cost 3 vsldoi8 <4,u,5,5>, <3,u,1,2>
-  3787705234U, // <5,5,4,0>: Cost 3 vsldoi8 <4,u,5,5>, <4,0,5,1>
+  2713963294U, // <5,5,3,u>: Cost 3 vsldoi8 <4,u,5,5>, <3,u,1,2>
+  2713963410U, // <5,5,4,0>: Cost 3 vsldoi8 <4,u,5,5>, <4,0,5,1>
   3827978127U, // <5,5,4,1>: Cost 4 vsldoi12 <0,4,1,5>, <5,4,1,5>
   3839479704U, // <5,5,4,2>: Cost 4 vsldoi12 <2,3,4,5>, <5,4,2,5>
   3376417846U, // <5,5,4,3>: Cost 4 vmrglw <3,4,5,4>, <4,2,5,3>
-  2711309530U, // <5,5,4,4>: Cost 2 vsldoi8 <4,4,5,5>, <4,4,5,5>
-  2713963830U, // <5,5,4,5>: Cost 2 vsldoi8 <4,u,5,5>, RHS
-  3384382822U, // <5,5,4,6>: Cost 3 vmrglw <4,7,5,4>, <7,4,5,6>
+  1637567706U, // <5,5,4,4>: Cost 2 vsldoi8 <4,4,5,5>, <4,4,5,5>
+  1640222006U, // <5,5,4,5>: Cost 2 vsldoi8 <4,u,5,5>, RHS
+  2310640998U, // <5,5,4,6>: Cost 3 vmrglw <4,7,5,4>, <7,4,5,6>
   3376418174U, // <5,5,4,7>: Cost 4 vmrglw <3,4,5,4>, <4,6,5,7>
-  2713964062U, // <5,5,4,u>: Cost 2 vsldoi8 <4,u,5,5>, <4,u,5,5>
-  2650832998U, // <5,5,5,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
-  3385052050U, // <5,5,5,1>: Cost 3 vmrglw <4,u,5,5>, <4,0,5,1>
-  3787706127U, // <5,5,5,2>: Cost 3 vsldoi8 <4,u,5,5>, <5,2,5,3>
-  3385052943U, // <5,5,5,3>: Cost 3 vmrglw <4,u,5,5>, <5,2,5,3>
-  2650836278U, // <5,5,5,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
-  1369886006U, // <5,5,5,5>: Cost 1 vspltisw1 RHS
-  3385051650U, // <5,5,5,6>: Cost 3 vmrglw <4,u,5,5>, <3,4,5,6>
-  3385053271U, // <5,5,5,7>: Cost 3 vmrglw <4,u,5,5>, <5,6,5,7>
-  1369886006U, // <5,5,5,u>: Cost 1 vspltisw1 RHS
-  3322695284U, // <5,5,6,0>: Cost 3 vmrghw <5,6,7,0>, <5,0,6,1>
-  3400321938U, // <5,5,6,1>: Cost 3 vmrglw <7,4,5,6>, <4,0,5,1>
-  3787706874U, // <5,5,6,2>: Cost 3 vsldoi8 <4,u,5,5>, <6,2,7,3>
+  1640222238U, // <5,5,4,u>: Cost 2 vsldoi8 <4,u,5,5>, <4,u,5,5>
+  1577091174U, // <5,5,5,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
+  2311310226U, // <5,5,5,1>: Cost 3 vmrglw <4,u,5,5>, <4,0,5,1>
+  2713964303U, // <5,5,5,2>: Cost 3 vsldoi8 <4,u,5,5>, <5,2,5,3>
+  2311311119U, // <5,5,5,3>: Cost 3 vmrglw <4,u,5,5>, <5,2,5,3>
+  1577094454U, // <5,5,5,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
+  296144182U,  // <5,5,5,5>: Cost 1 vspltisw1 RHS
+  2311309826U, // <5,5,5,6>: Cost 3 vmrglw <4,u,5,5>, <3,4,5,6>
+  2311311447U, // <5,5,5,7>: Cost 3 vmrglw <4,u,5,5>, <5,6,5,7>
+  296144182U,  // <5,5,5,u>: Cost 1 vspltisw1 RHS
+  2248953460U, // <5,5,6,0>: Cost 3 vmrghw <5,6,7,0>, <5,0,6,1>
+  2326580114U, // <5,5,6,1>: Cost 3 vmrglw <7,4,5,6>, <4,0,5,1>
+  2713965050U, // <5,5,6,2>: Cost 3 vsldoi8 <4,u,5,5>, <6,2,7,3>
   3700697602U, // <5,5,6,3>: Cost 4 vsldoi4 <1,5,5,6>, <3,4,5,6>
-  3859386444U, // <5,5,6,4>: Cost 3 vsldoi12 <5,6,4,5>, <5,6,4,5>
-  3854815319U, // <5,5,6,5>: Cost 3 vsldoi12 <4,u,5,5>, <5,6,5,7>
-  2302691842U, // <5,5,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
-  3787707214U, // <5,5,6,7>: Cost 3 vsldoi8 <4,u,5,5>, <6,7,0,1>
-  2302691842U, // <5,5,6,u>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
-  3787707386U, // <5,5,7,0>: Cost 3 vsldoi8 <4,u,5,5>, <7,0,1,2>
+  2785644620U, // <5,5,6,4>: Cost 3 vsldoi12 <5,6,4,5>, <5,6,4,5>
+  2781073495U, // <5,5,6,5>: Cost 3 vsldoi12 <4,u,5,5>, <5,6,5,7>
+  1228950018U, // <5,5,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
+  2713965390U, // <5,5,6,7>: Cost 3 vsldoi8 <4,u,5,5>, <6,7,0,1>
+  1228950018U, // <5,5,6,u>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
+  2713965562U, // <5,5,7,0>: Cost 3 vsldoi8 <4,u,5,5>, <7,0,1,2>
   3383741330U, // <5,5,7,1>: Cost 4 vmrglw <4,6,5,7>, <4,0,5,1>
   3718620878U, // <5,5,7,2>: Cost 4 vsldoi4 <4,5,5,7>, <2,3,4,5>
   3365823403U, // <5,5,7,3>: Cost 4 vmrglw <1,6,5,7>, <1,2,5,3>
-  3787707750U, // <5,5,7,4>: Cost 3 vsldoi8 <4,u,5,5>, <7,4,5,6>
-  3791689142U, // <5,5,7,5>: Cost 3 vsldoi8 <5,5,5,5>, <7,5,5,5>
+  2713965926U, // <5,5,7,4>: Cost 3 vsldoi8 <4,u,5,5>, <7,4,5,6>
+  2717947318U, // <5,5,7,5>: Cost 3 vsldoi8 <5,5,5,5>, <7,5,5,5>
   3365825026U, // <5,5,7,6>: Cost 4 vmrglw <1,6,5,7>, <3,4,5,6>
-  3365823731U, // <5,5,7,7>: Cost 3 vmrglw <1,6,5,7>, <1,6,5,7>
-  3787708034U, // <5,5,7,u>: Cost 3 vsldoi8 <4,u,5,5>, <7,u,1,2>
-  2650832998U, // <5,5,u,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
-  2713966382U, // <5,5,u,1>: Cost 2 vsldoi8 <4,u,5,5>, LHS
-  3787708293U, // <5,5,u,2>: Cost 3 vsldoi8 <4,u,5,5>, <u,2,3,0>
-  3787708348U, // <5,5,u,3>: Cost 3 vsldoi8 <4,u,5,5>, <u,3,0,1>
-  2650836278U, // <5,5,u,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
-  1369886006U, // <5,5,u,5>: Cost 1 vspltisw1 RHS
-  2302691842U, // <5,5,u,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
-  3787708672U, // <5,5,u,7>: Cost 3 vsldoi8 <4,u,5,5>, <u,7,0,1>
-  1369886006U, // <5,5,u,u>: Cost 1 vspltisw1 RHS
-  3779084288U, // <5,6,0,0>: Cost 3 vsldoi8 <3,4,5,6>, <0,0,0,0>
-  2705342566U, // <5,6,0,1>: Cost 2 vsldoi8 <3,4,5,6>, LHS
+  2292081907U, // <5,5,7,7>: Cost 3 vmrglw <1,6,5,7>, <1,6,5,7>
+  2713966210U, // <5,5,7,u>: Cost 3 vsldoi8 <4,u,5,5>, <7,u,1,2>
+  1577091174U, // <5,5,u,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
+  1640224558U, // <5,5,u,1>: Cost 2 vsldoi8 <4,u,5,5>, LHS
+  2713966469U, // <5,5,u,2>: Cost 3 vsldoi8 <4,u,5,5>, <u,2,3,0>
+  2713966524U, // <5,5,u,3>: Cost 3 vsldoi8 <4,u,5,5>, <u,3,0,1>
+  1577094454U, // <5,5,u,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
+  296144182U,  // <5,5,u,5>: Cost 1 vspltisw1 RHS
+  1228950018U, // <5,5,u,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
+  2713966848U, // <5,5,u,7>: Cost 3 vsldoi8 <4,u,5,5>, <u,7,0,1>
+  296144182U,  // <5,5,u,u>: Cost 1 vspltisw1 RHS
+  2705342464U, // <5,6,0,0>: Cost 3 vsldoi8 <3,4,5,6>, <0,0,0,0>
+  1631600742U, // <5,6,0,1>: Cost 2 vsldoi8 <3,4,5,6>, LHS
   3773112493U, // <5,6,0,2>: Cost 4 vsldoi8 <2,4,5,6>, <0,2,1,2>
-  3779084544U, // <5,6,0,3>: Cost 3 vsldoi8 <3,4,5,6>, <0,3,1,4>
-  3779084626U, // <5,6,0,4>: Cost 3 vsldoi8 <3,4,5,6>, <0,4,1,5>
+  2705342720U, // <5,6,0,3>: Cost 3 vsldoi8 <3,4,5,6>, <0,3,1,4>
+  2705342802U, // <5,6,0,4>: Cost 3 vsldoi8 <3,4,5,6>, <0,4,1,5>
   3779084708U, // <5,6,0,5>: Cost 4 vsldoi8 <3,4,5,6>, <0,5,1,6>
   3779084790U, // <5,6,0,6>: Cost 4 vsldoi8 <3,4,5,6>, <0,6,1,7>
-  3376385334U, // <5,6,0,7>: Cost 3 vmrglw <3,4,5,0>, RHS
-  2705343133U, // <5,6,0,u>: Cost 2 vsldoi8 <3,4,5,6>, LHS
+  2302643510U, // <5,6,0,7>: Cost 3 vmrglw <3,4,5,0>, RHS
+  1631601309U, // <5,6,0,u>: Cost 2 vsldoi8 <3,4,5,6>, LHS
   3767141092U, // <5,6,1,0>: Cost 4 vsldoi8 <1,4,5,6>, <1,0,1,2>
-  3779085108U, // <5,6,1,1>: Cost 3 vsldoi8 <3,4,5,6>, <1,1,1,1>
-  3779085206U, // <5,6,1,2>: Cost 3 vsldoi8 <3,4,5,6>, <1,2,3,0>
+  2705343284U, // <5,6,1,1>: Cost 3 vsldoi8 <3,4,5,6>, <1,1,1,1>
+  2705343382U, // <5,6,1,2>: Cost 3 vsldoi8 <3,4,5,6>, <1,2,3,0>
   3779085282U, // <5,6,1,3>: Cost 4 vsldoi8 <3,4,5,6>, <1,3,2,4>
-  3767141456U, // <5,6,1,4>: Cost 3 vsldoi8 <1,4,5,6>, <1,4,5,6>
+  2693399632U, // <5,6,1,4>: Cost 3 vsldoi8 <1,4,5,6>, <1,4,5,6>
   3767805089U, // <5,6,1,5>: Cost 4 vsldoi8 <1,5,5,6>, <1,5,5,6>
-  3385021240U, // <5,6,1,6>: Cost 3 vmrglw <4,u,5,1>, <6,6,6,6>
-  2311277878U, // <5,6,1,7>: Cost 2 vmrglw <4,u,5,1>, RHS
-  2311277879U, // <5,6,1,u>: Cost 2 vmrglw <4,u,5,1>, RHS
+  2311279416U, // <5,6,1,6>: Cost 3 vmrglw <4,u,5,1>, <6,6,6,6>
+  1237536054U, // <5,6,1,7>: Cost 2 vmrglw <4,u,5,1>, RHS
+  1237536055U, // <5,6,1,u>: Cost 2 vmrglw <4,u,5,1>, RHS
   3773113789U, // <5,6,2,0>: Cost 4 vsldoi8 <2,4,5,6>, <2,0,1,2>
   3779085855U, // <5,6,2,1>: Cost 4 vsldoi8 <3,4,5,6>, <2,1,3,1>
-  3773113960U, // <5,6,2,2>: Cost 3 vsldoi8 <2,4,5,6>, <2,2,2,2>
-  3779085990U, // <5,6,2,3>: Cost 3 vsldoi8 <3,4,5,6>, <2,3,0,1>
-  3773114153U, // <5,6,2,4>: Cost 3 vsldoi8 <2,4,5,6>, <2,4,5,6>
-  3779086184U, // <5,6,2,5>: Cost 3 vsldoi8 <3,4,5,6>, <2,5,3,6>
-  3779086266U, // <5,6,2,6>: Cost 3 vsldoi8 <3,4,5,6>, <2,6,3,7>
-  3376401718U, // <5,6,2,7>: Cost 3 vmrglw <3,4,5,2>, RHS
-  3775768685U, // <5,6,2,u>: Cost 3 vsldoi8 <2,u,5,6>, <2,u,5,6>
-  3779086486U, // <5,6,3,0>: Cost 3 vsldoi8 <3,4,5,6>, <3,0,1,2>
+  2699372136U, // <5,6,2,2>: Cost 3 vsldoi8 <2,4,5,6>, <2,2,2,2>
+  2705344166U, // <5,6,2,3>: Cost 3 vsldoi8 <3,4,5,6>, <2,3,0,1>
+  2699372329U, // <5,6,2,4>: Cost 3 vsldoi8 <2,4,5,6>, <2,4,5,6>
+  2705344360U, // <5,6,2,5>: Cost 3 vsldoi8 <3,4,5,6>, <2,5,3,6>
+  2705344442U, // <5,6,2,6>: Cost 3 vsldoi8 <3,4,5,6>, <2,6,3,7>
+  2302659894U, // <5,6,2,7>: Cost 3 vmrglw <3,4,5,2>, RHS
+  2702026861U, // <5,6,2,u>: Cost 3 vsldoi8 <2,u,5,6>, <2,u,5,6>
+  2705344662U, // <5,6,3,0>: Cost 3 vsldoi8 <3,4,5,6>, <3,0,1,2>
   3767142661U, // <5,6,3,1>: Cost 4 vsldoi8 <1,4,5,6>, <3,1,4,5>
   3773114689U, // <5,6,3,2>: Cost 4 vsldoi8 <2,4,5,6>, <3,2,2,2>
-  3779086748U, // <5,6,3,3>: Cost 3 vsldoi8 <3,4,5,6>, <3,3,3,3>
-  2705345026U, // <5,6,3,4>: Cost 2 vsldoi8 <3,4,5,6>, <3,4,5,6>
+  2705344924U, // <5,6,3,3>: Cost 3 vsldoi8 <3,4,5,6>, <3,3,3,3>
+  1631603202U, // <5,6,3,4>: Cost 2 vsldoi8 <3,4,5,6>, <3,4,5,6>
   3842945597U, // <5,6,3,5>: Cost 4 vsldoi12 <2,u,6,5>, <6,3,5,7>
   3779086962U, // <5,6,3,6>: Cost 4 vsldoi8 <3,4,5,6>, <3,6,0,1>
-  3363138870U, // <5,6,3,7>: Cost 3 vmrglw <1,2,5,3>, RHS
-  2707999558U, // <5,6,3,u>: Cost 2 vsldoi8 <3,u,5,6>, <3,u,5,6>
-  3718668390U, // <5,6,4,0>: Cost 3 vsldoi4 <4,5,6,4>, LHS
+  2289397046U, // <5,6,3,7>: Cost 3 vmrglw <1,2,5,3>, RHS
+  1634257734U, // <5,6,3,u>: Cost 2 vsldoi8 <3,u,5,6>, <3,u,5,6>
+  2644926566U, // <5,6,4,0>: Cost 3 vsldoi4 <4,5,6,4>, LHS
   3779087306U, // <5,6,4,1>: Cost 4 vsldoi8 <3,4,5,6>, <4,1,2,3>
-  3863884401U, // <5,6,4,2>: Cost 3 vsldoi12 <6,4,2,5>, <6,4,2,5>
-  3718670850U, // <5,6,4,3>: Cost 3 vsldoi4 <4,5,6,4>, <3,4,5,6>
-  3785059547U, // <5,6,4,4>: Cost 3 vsldoi8 <4,4,5,6>, <4,4,5,6>
-  2705345846U, // <5,6,4,5>: Cost 2 vsldoi8 <3,4,5,6>, RHS
-  3786386813U, // <5,6,4,6>: Cost 3 vsldoi8 <4,6,5,6>, <4,6,5,6>
-  3376418102U, // <5,6,4,7>: Cost 3 vmrglw <3,4,5,4>, RHS
-  2705346089U, // <5,6,4,u>: Cost 2 vsldoi8 <3,4,5,6>, RHS
+  2790142577U, // <5,6,4,2>: Cost 3 vsldoi12 <6,4,2,5>, <6,4,2,5>
+  2644929026U, // <5,6,4,3>: Cost 3 vsldoi4 <4,5,6,4>, <3,4,5,6>
+  2711317723U, // <5,6,4,4>: Cost 3 vsldoi8 <4,4,5,6>, <4,4,5,6>
+  1631604022U, // <5,6,4,5>: Cost 2 vsldoi8 <3,4,5,6>, RHS
+  2712644989U, // <5,6,4,6>: Cost 3 vsldoi8 <4,6,5,6>, <4,6,5,6>
+  2302676278U, // <5,6,4,7>: Cost 3 vmrglw <3,4,5,4>, RHS
+  1631604265U, // <5,6,4,u>: Cost 2 vsldoi8 <3,4,5,6>, RHS
   3842945708U, // <5,6,5,0>: Cost 4 vsldoi12 <2,u,6,5>, <6,5,0,1>
   3767144133U, // <5,6,5,1>: Cost 4 vsldoi8 <1,4,5,6>, <5,1,6,1>
-  3779088152U, // <5,6,5,2>: Cost 3 vsldoi8 <3,4,5,6>, <5,2,6,3>
+  2705346328U, // <5,6,5,2>: Cost 3 vsldoi8 <3,4,5,6>, <5,2,6,3>
   3779088207U, // <5,6,5,3>: Cost 4 vsldoi8 <3,4,5,6>, <5,3,3,4>
-  3791032244U, // <5,6,5,4>: Cost 3 vsldoi8 <5,4,5,6>, <5,4,5,6>
-  3779088398U, // <5,6,5,5>: Cost 3 vsldoi8 <3,4,5,6>, <5,5,6,6>
-  3779088420U, // <5,6,5,6>: Cost 3 vsldoi8 <3,4,5,6>, <5,6,0,1>
-  2311310646U, // <5,6,5,7>: Cost 2 vmrglw <4,u,5,5>, RHS
-  2311310647U, // <5,6,5,u>: Cost 2 vmrglw <4,u,5,5>, RHS
-  3724656742U, // <5,6,6,0>: Cost 3 vsldoi4 <5,5,6,6>, LHS
+  2717290420U, // <5,6,5,4>: Cost 3 vsldoi8 <5,4,5,6>, <5,4,5,6>
+  2705346574U, // <5,6,5,5>: Cost 3 vsldoi8 <3,4,5,6>, <5,5,6,6>
+  2705346596U, // <5,6,5,6>: Cost 3 vsldoi8 <3,4,5,6>, <5,6,0,1>
+  1237568822U, // <5,6,5,7>: Cost 2 vmrglw <4,u,5,5>, RHS
+  1237568823U, // <5,6,5,u>: Cost 2 vmrglw <4,u,5,5>, RHS
+  2650914918U, // <5,6,6,0>: Cost 3 vsldoi4 <5,5,6,6>, LHS
   3364490949U, // <5,6,6,1>: Cost 4 vmrglw <1,4,5,6>, <5,1,6,1>
-  3322696186U, // <5,6,6,2>: Cost 3 vmrghw <5,6,7,0>, <6,2,7,3>
-  3376434968U, // <5,6,6,3>: Cost 3 vmrglw <3,4,5,6>, <5,2,6,3>
-  3724660022U, // <5,6,6,4>: Cost 3 vsldoi4 <5,5,6,6>, RHS
-  3724660750U, // <5,6,6,5>: Cost 3 vsldoi4 <5,5,6,6>, <5,5,6,6>
-  3376435214U, // <5,6,6,6>: Cost 3 vmrglw <3,4,5,6>, <5,5,6,6>
-  2302692662U, // <5,6,6,7>: Cost 2 vmrglw <3,4,5,6>, RHS
-  2302692663U, // <5,6,6,u>: Cost 2 vmrglw <3,4,5,6>, RHS
-  1571209318U, // <5,6,7,0>: Cost 1 vsldoi4 RHS, LHS
-  2644951860U, // <5,6,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
-  2644952680U, // <5,6,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
-  2644953238U, // <5,6,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
-  1571212598U, // <5,6,7,4>: Cost 1 vsldoi4 RHS, RHS
-  2644955140U, // <5,6,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
-  2644955642U, // <5,6,7,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
-  2644956780U, // <5,6,7,7>: Cost 2 vsldoi4 RHS, <7,7,7,7>
-  1571215150U, // <5,6,7,u>: Cost 1 vsldoi4 RHS, LHS
-  1571217510U, // <5,6,u,0>: Cost 1 vsldoi4 RHS, LHS
-  2705348398U, // <5,6,u,1>: Cost 2 vsldoi8 <3,4,5,6>, LHS
-  2644960872U, // <5,6,u,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
-  2644961430U, // <5,6,u,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
-  1571220791U, // <5,6,u,4>: Cost 1 vsldoi4 RHS, RHS
-  2705348762U, // <5,6,u,5>: Cost 2 vsldoi8 <3,4,5,6>, RHS
-  2644963834U, // <5,6,u,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
-  2302709046U, // <5,6,u,7>: Cost 2 vmrglw <3,4,5,u>, RHS
-  1571223342U, // <5,6,u,u>: Cost 1 vsldoi4 RHS, LHS
+  2248954362U, // <5,6,6,2>: Cost 3 vmrghw <5,6,7,0>, <6,2,7,3>
+  2302693144U, // <5,6,6,3>: Cost 3 vmrglw <3,4,5,6>, <5,2,6,3>
+  2650918198U, // <5,6,6,4>: Cost 3 vsldoi4 <5,5,6,6>, RHS
+  2650918926U, // <5,6,6,5>: Cost 3 vsldoi4 <5,5,6,6>, <5,5,6,6>
+  2302693390U, // <5,6,6,6>: Cost 3 vmrglw <3,4,5,6>, <5,5,6,6>
+  1228950838U, // <5,6,6,7>: Cost 2 vmrglw <3,4,5,6>, RHS
+  1228950839U, // <5,6,6,u>: Cost 2 vmrglw <3,4,5,6>, RHS
+  497467494U,  // <5,6,7,0>: Cost 1 vsldoi4 RHS, LHS
+  1571210036U, // <5,6,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
+  1571210856U, // <5,6,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
+  1571211414U, // <5,6,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
+  497470774U,  // <5,6,7,4>: Cost 1 vsldoi4 RHS, RHS
+  1571213316U, // <5,6,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
+  1571213818U, // <5,6,7,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
+  1571214956U, // <5,6,7,7>: Cost 2 vsldoi4 RHS, <7,7,7,7>
+  497473326U,  // <5,6,7,u>: Cost 1 vsldoi4 RHS, LHS
+  497475686U,  // <5,6,u,0>: Cost 1 vsldoi4 RHS, LHS
+  1631606574U, // <5,6,u,1>: Cost 2 vsldoi8 <3,4,5,6>, LHS
+  1571219048U, // <5,6,u,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
+  1571219606U, // <5,6,u,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
+  497478967U,  // <5,6,u,4>: Cost 1 vsldoi4 RHS, RHS
+  1631606938U, // <5,6,u,5>: Cost 2 vsldoi8 <3,4,5,6>, RHS
+  1571222010U, // <5,6,u,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
+  1228967222U, // <5,6,u,7>: Cost 2 vmrglw <3,4,5,u>, RHS
+  497481518U,  // <5,6,u,u>: Cost 1 vsldoi4 RHS, LHS
   3768475648U, // <5,7,0,0>: Cost 4 vsldoi8 <1,6,5,7>, <0,0,0,0>
-  3768475750U, // <5,7,0,1>: Cost 3 vsldoi8 <1,6,5,7>, LHS
+  2694733926U, // <5,7,0,1>: Cost 3 vsldoi8 <1,6,5,7>, LHS
   3718711395U, // <5,7,0,2>: Cost 4 vsldoi4 <4,5,7,0>, <2,u,4,5>
   3384349178U, // <5,7,0,3>: Cost 4 vmrglw <4,7,5,0>, <6,2,7,3>
-  3768475986U, // <5,7,0,4>: Cost 3 vsldoi8 <1,6,5,7>, <0,4,1,5>
+  2694734162U, // <5,7,0,4>: Cost 3 vsldoi8 <1,6,5,7>, <0,4,1,5>
   3384347884U, // <5,7,0,5>: Cost 4 vmrglw <4,7,5,0>, <4,4,7,5>
   3730658026U, // <5,7,0,6>: Cost 4 vsldoi4 <6,5,7,0>, <6,5,7,0>
   3718714362U, // <5,7,0,7>: Cost 4 vsldoi4 <4,5,7,0>, <7,0,1,2>
-  3768476317U, // <5,7,0,u>: Cost 3 vsldoi8 <1,6,5,7>, LHS
-  3385020514U, // <5,7,1,0>: Cost 3 vmrglw <4,u,5,1>, <5,6,7,0>
-  3379712747U, // <5,7,1,1>: Cost 3 vmrglw <4,0,5,1>, <6,5,7,1>
+  2694734493U, // <5,7,0,u>: Cost 3 vsldoi8 <1,6,5,7>, LHS
+  2311278690U, // <5,7,1,0>: Cost 3 vmrglw <4,u,5,1>, <5,6,7,0>
+  2305970923U, // <5,7,1,1>: Cost 3 vmrglw <4,0,5,1>, <6,5,7,1>
   3768476566U, // <5,7,1,2>: Cost 4 vsldoi8 <1,6,5,7>, <1,2,3,0>
-  3385020922U, // <5,7,1,3>: Cost 3 vmrglw <4,u,5,1>, <6,2,7,3>
-  3385020518U, // <5,7,1,4>: Cost 3 vmrglw <4,u,5,1>, <5,6,7,4>
+  2311279098U, // <5,7,1,3>: Cost 3 vmrglw <4,u,5,1>, <6,2,7,3>
+  2311278694U, // <5,7,1,4>: Cost 3 vmrglw <4,u,5,1>, <5,6,7,4>
   3768476783U, // <5,7,1,5>: Cost 4 vsldoi8 <1,6,5,7>, <1,5,0,1>
-  3768476915U, // <5,7,1,6>: Cost 3 vsldoi8 <1,6,5,7>, <1,6,5,7>
-  3385021250U, // <5,7,1,7>: Cost 3 vmrglw <4,u,5,1>, <6,6,7,7>
-  3769804181U, // <5,7,1,u>: Cost 3 vsldoi8 <1,u,5,7>, <1,u,5,7>
+  2694735091U, // <5,7,1,6>: Cost 3 vsldoi8 <1,6,5,7>, <1,6,5,7>
+  2311279426U, // <5,7,1,7>: Cost 3 vmrglw <4,u,5,1>, <6,6,7,7>
+  2696062357U, // <5,7,1,u>: Cost 3 vsldoi8 <1,u,5,7>, <1,u,5,7>
   3383701602U, // <5,7,2,0>: Cost 4 vmrglw <4,6,5,2>, <5,6,7,0>
   3768477219U, // <5,7,2,1>: Cost 4 vsldoi8 <1,6,5,7>, <2,1,3,5>
   3768477288U, // <5,7,2,2>: Cost 4 vsldoi8 <1,6,5,7>, <2,2,2,2>
-  3383702010U, // <5,7,2,3>: Cost 3 vmrglw <4,6,5,2>, <6,2,7,3>
+  2309960186U, // <5,7,2,3>: Cost 3 vmrglw <4,6,5,2>, <6,2,7,3>
   3383701606U, // <5,7,2,4>: Cost 4 vmrglw <4,6,5,2>, <5,6,7,4>
   3768477545U, // <5,7,2,5>: Cost 4 vsldoi8 <1,6,5,7>, <2,5,3,7>
   3766486970U, // <5,7,2,6>: Cost 4 vsldoi8 <1,3,5,7>, <2,6,3,7>
   3383702338U, // <5,7,2,7>: Cost 4 vmrglw <4,6,5,2>, <6,6,7,7>
-  3383702010U, // <5,7,2,u>: Cost 3 vmrglw <4,6,5,2>, <6,2,7,3>
+  2309960186U, // <5,7,2,u>: Cost 3 vmrglw <4,6,5,2>, <6,2,7,3>
   3768477846U, // <5,7,3,0>: Cost 4 vsldoi8 <1,6,5,7>, <3,0,1,2>
   3768477975U, // <5,7,3,1>: Cost 4 vsldoi8 <1,6,5,7>, <3,1,6,5>
   3786393932U, // <5,7,3,2>: Cost 4 vsldoi8 <4,6,5,7>, <3,2,3,4>
   3768478108U, // <5,7,3,3>: Cost 4 vsldoi8 <1,6,5,7>, <3,3,3,3>
-  3869340939U, // <5,7,3,4>: Cost 3 vsldoi12 <7,3,4,5>, <7,3,4,5>
+  2795599115U, // <5,7,3,4>: Cost 3 vsldoi12 <7,3,4,5>, <7,3,4,5>
   3385037470U, // <5,7,3,5>: Cost 4 vmrglw <4,u,5,3>, <6,4,7,5>
   3780422309U, // <5,7,3,6>: Cost 4 vsldoi8 <3,6,5,7>, <3,6,5,7>
   3848107301U, // <5,7,3,7>: Cost 4 vsldoi12 <3,7,4,5>, <7,3,7,4>
-  3869635887U, // <5,7,3,u>: Cost 3 vsldoi12 <7,3,u,5>, <7,3,u,5>
-  3869709624U, // <5,7,4,0>: Cost 3 vsldoi12 <7,4,0,5>, <7,4,0,5>
+  2795894063U, // <5,7,3,u>: Cost 3 vsldoi12 <7,3,u,5>, <7,3,u,5>
+  2795967800U, // <5,7,4,0>: Cost 3 vsldoi12 <7,4,0,5>, <7,4,0,5>
   3768478690U, // <5,7,4,1>: Cost 4 vsldoi8 <1,6,5,7>, <4,1,5,0>
   3718744163U, // <5,7,4,2>: Cost 4 vsldoi4 <4,5,7,4>, <2,u,4,5>
   3784404107U, // <5,7,4,3>: Cost 4 vsldoi8 <4,3,5,7>, <4,3,5,7>
-  3870004572U, // <5,7,4,4>: Cost 3 vsldoi12 <7,4,4,5>, <7,4,4,5>
-  3768479030U, // <5,7,4,5>: Cost 3 vsldoi8 <1,6,5,7>, RHS
-  3786395006U, // <5,7,4,6>: Cost 3 vsldoi8 <4,6,5,7>, <4,6,5,7>
-  3787058639U, // <5,7,4,7>: Cost 3 vsldoi8 <4,7,5,7>, <4,7,5,7>
-  3768479273U, // <5,7,4,u>: Cost 3 vsldoi8 <1,6,5,7>, RHS
-  3385053282U, // <5,7,5,0>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,0>
+  2796262748U, // <5,7,4,4>: Cost 3 vsldoi12 <7,4,4,5>, <7,4,4,5>
+  2694737206U, // <5,7,4,5>: Cost 3 vsldoi8 <1,6,5,7>, RHS
+  2712653182U, // <5,7,4,6>: Cost 3 vsldoi8 <4,6,5,7>, <4,6,5,7>
+  2713316815U, // <5,7,4,7>: Cost 3 vsldoi8 <4,7,5,7>, <4,7,5,7>
+  2694737449U, // <5,7,4,u>: Cost 3 vsldoi8 <1,6,5,7>, RHS
+  2311311458U, // <5,7,5,0>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,0>
   3768479433U, // <5,7,5,1>: Cost 4 vsldoi8 <1,6,5,7>, <5,1,6,5>
   3768479521U, // <5,7,5,2>: Cost 4 vsldoi8 <1,6,5,7>, <5,2,7,3>
-  3385053690U, // <5,7,5,3>: Cost 3 vmrglw <4,u,5,5>, <6,2,7,3>
-  3385053286U, // <5,7,5,4>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,4>
-  3321927094U, // <5,7,5,5>: Cost 3 vmrghw <5,5,5,5>, <7,5,5,5>
-  3792367703U, // <5,7,5,6>: Cost 3 vsldoi8 <5,6,5,7>, <5,6,5,7>
-  3385054018U, // <5,7,5,7>: Cost 3 vmrglw <4,u,5,5>, <6,6,7,7>
-  3385053290U, // <5,7,5,u>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,u>
-  3322696698U, // <5,7,6,0>: Cost 3 vmrghw <5,6,7,0>, <7,0,1,2>
+  2311311866U, // <5,7,5,3>: Cost 3 vmrglw <4,u,5,5>, <6,2,7,3>
+  2311311462U, // <5,7,5,4>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,4>
+  2248185270U, // <5,7,5,5>: Cost 3 vmrghw <5,5,5,5>, <7,5,5,5>
+  2718625879U, // <5,7,5,6>: Cost 3 vsldoi8 <5,6,5,7>, <5,6,5,7>
+  2311312194U, // <5,7,5,7>: Cost 3 vmrglw <4,u,5,5>, <6,6,7,7>
+  2311311466U, // <5,7,5,u>: Cost 3 vmrglw <4,u,5,5>, <5,6,7,u>
+  2248954874U, // <5,7,6,0>: Cost 3 vmrghw <5,6,7,0>, <7,0,1,2>
   3322696778U, // <5,7,6,1>: Cost 4 vmrghw <5,6,7,0>, <7,1,1,1>
-  3322696852U, // <5,7,6,2>: Cost 3 vmrghw <5,6,7,0>, <7,2,0,3>
-  3730704898U, // <5,7,6,3>: Cost 3 vsldoi4 <6,5,7,6>, <3,4,5,6>
-  3322697062U, // <5,7,6,4>: Cost 3 vmrghw <5,6,7,0>, <7,4,5,6>
-  3322697153U, // <5,7,6,5>: Cost 3 vmrghw <5,6,7,0>, <7,5,6,7>
-  3730707184U, // <5,7,6,6>: Cost 3 vsldoi4 <6,5,7,6>, <6,5,7,6>
-  3322697324U, // <5,7,6,7>: Cost 3 vmrghw <5,6,7,0>, <7,7,7,7>
-  3322697346U, // <5,7,6,u>: Cost 3 vmrghw <5,6,7,0>, <7,u,1,2>
+  2248955028U, // <5,7,6,2>: Cost 3 vmrghw <5,6,7,0>, <7,2,0,3>
+  2656963074U, // <5,7,6,3>: Cost 3 vsldoi4 <6,5,7,6>, <3,4,5,6>
+  2248955238U, // <5,7,6,4>: Cost 3 vmrghw <5,6,7,0>, <7,4,5,6>
+  2248955329U, // <5,7,6,5>: Cost 3 vmrghw <5,6,7,0>, <7,5,6,7>
+  2656965360U, // <5,7,6,6>: Cost 3 vsldoi4 <6,5,7,6>, <6,5,7,6>
+  2248955500U, // <5,7,6,7>: Cost 3 vmrghw <5,6,7,0>, <7,7,7,7>
+  2248955522U, // <5,7,6,u>: Cost 3 vmrghw <5,6,7,0>, <7,u,1,2>
   3718766694U, // <5,7,7,0>: Cost 4 vsldoi4 <4,5,7,7>, LHS
   3724739827U, // <5,7,7,1>: Cost 4 vsldoi4 <5,5,7,7>, <1,6,5,7>
   3718768739U, // <5,7,7,2>: Cost 4 vsldoi4 <4,5,7,7>, <2,u,4,5>
   3365826337U, // <5,7,7,3>: Cost 4 vmrglw <1,6,5,7>, <5,2,7,3>
-  3871995471U, // <5,7,7,4>: Cost 3 vsldoi12 <7,7,4,5>, <7,7,4,5>
+  2798253647U, // <5,7,7,4>: Cost 3 vsldoi12 <7,7,4,5>, <7,7,4,5>
   3365826258U, // <5,7,7,5>: Cost 4 vmrglw <1,6,5,7>, <5,1,7,5>
   3730715377U, // <5,7,7,6>: Cost 4 vsldoi4 <6,5,7,7>, <6,5,7,7>
-  3384407660U, // <5,7,7,7>: Cost 3 vmrglw <4,7,5,7>, <7,7,7,7>
-  3872290419U, // <5,7,7,u>: Cost 3 vsldoi12 <7,7,u,5>, <7,7,u,5>
-  3385077858U, // <5,7,u,0>: Cost 3 vmrglw <4,u,5,u>, <5,6,7,0>
-  3768481582U, // <5,7,u,1>: Cost 3 vsldoi8 <1,6,5,7>, LHS
-  3322696852U, // <5,7,u,2>: Cost 3 vmrghw <5,6,7,0>, <7,2,0,3>
-  3385078266U, // <5,7,u,3>: Cost 3 vmrglw <4,u,5,u>, <6,2,7,3>
-  3385077862U, // <5,7,u,4>: Cost 3 vmrglw <4,u,5,u>, <5,6,7,4>
-  3768481946U, // <5,7,u,5>: Cost 3 vsldoi8 <1,6,5,7>, RHS
-  3730723570U, // <5,7,u,6>: Cost 3 vsldoi4 <6,5,7,u>, <6,5,7,u>
-  3385078594U, // <5,7,u,7>: Cost 3 vmrglw <4,u,5,u>, <6,6,7,7>
-  3768482149U, // <5,7,u,u>: Cost 3 vsldoi8 <1,6,5,7>, LHS
-  3779100672U, // <5,u,0,0>: Cost 3 vsldoi8 <3,4,5,u>, <0,0,0,0>
-  2705358950U, // <5,u,0,1>: Cost 2 vsldoi8 <3,4,5,u>, LHS
-  3384349690U, // <5,u,0,2>: Cost 3 vmrglw <4,7,5,0>, <7,0,1,2>
-  3376382108U, // <5,u,0,3>: Cost 3 vmrglw <3,4,5,0>, LHS
-  3827980013U, // <5,u,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <u,0,4,1>
-  3379037938U, // <5,u,0,5>: Cost 3 vmrglw <3,u,5,0>, <2,3,u,5>
-  3318648930U, // <5,u,0,6>: Cost 3 vmrghw <5,0,6,1>, <5,6,7,0>
-  3376385352U, // <5,u,0,7>: Cost 3 vmrglw <3,4,5,0>, RHS
-  2705359517U, // <5,u,0,u>: Cost 2 vsldoi8 <3,4,5,u>, LHS
-  3700875366U, // <5,u,1,0>: Cost 3 vsldoi4 <1,5,u,1>, LHS
-  2311278106U, // <5,u,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
-  2754238254U, // <5,u,1,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
-  2311274652U, // <5,u,1,3>: Cost 2 vmrglw <4,u,5,1>, LHS
-  3767157842U, // <5,u,1,4>: Cost 3 vsldoi8 <1,4,5,u>, <1,4,5,u>
-  3830634310U, // <5,u,1,5>: Cost 3 vsldoi12 <0,u,1,5>, <u,1,5,0>
-  3768485108U, // <5,u,1,6>: Cost 3 vsldoi8 <1,6,5,u>, <1,6,5,u>
-  2311277896U, // <5,u,1,7>: Cost 2 vmrglw <4,u,5,1>, RHS
-  2754238308U, // <5,u,1,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
-  3385030533U, // <5,u,2,0>: Cost 3 vmrglw <4,u,5,2>, <u,2,3,0>
-  3319625518U, // <5,u,2,1>: Cost 3 vmrghw <5,2,1,3>, LHS
-  3773130344U, // <5,u,2,2>: Cost 3 vsldoi8 <2,4,5,u>, <2,2,2,2>
-  3827980168U, // <5,u,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <u,2,3,3>
-  3773130539U, // <5,u,2,4>: Cost 3 vsldoi8 <2,4,5,u>, <2,4,5,u>
-  3831150490U, // <5,u,2,5>: Cost 3 vsldoi12 <0,u,u,5>, <u,2,5,3>
-  3779102650U, // <5,u,2,6>: Cost 3 vsldoi8 <3,4,5,u>, <2,6,3,7>
-  3376401736U, // <5,u,2,7>: Cost 3 vmrglw <3,4,5,2>, RHS
-  3827980213U, // <5,u,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <u,2,u,3>
-  3827980220U, // <5,u,3,0>: Cost 3 vsldoi12 <0,4,1,5>, <u,3,0,1>
+  2310665836U, // <5,7,7,7>: Cost 3 vmrglw <4,7,5,7>, <7,7,7,7>
+  2798548595U, // <5,7,7,u>: Cost 3 vsldoi12 <7,7,u,5>, <7,7,u,5>
+  2311336034U, // <5,7,u,0>: Cost 3 vmrglw <4,u,5,u>, <5,6,7,0>
+  2694739758U, // <5,7,u,1>: Cost 3 vsldoi8 <1,6,5,7>, LHS
+  2248955028U, // <5,7,u,2>: Cost 3 vmrghw <5,6,7,0>, <7,2,0,3>
+  2311336442U, // <5,7,u,3>: Cost 3 vmrglw <4,u,5,u>, <6,2,7,3>
+  2311336038U, // <5,7,u,4>: Cost 3 vmrglw <4,u,5,u>, <5,6,7,4>
+  2694740122U, // <5,7,u,5>: Cost 3 vsldoi8 <1,6,5,7>, RHS
+  2656981746U, // <5,7,u,6>: Cost 3 vsldoi4 <6,5,7,u>, <6,5,7,u>
+  2311336770U, // <5,7,u,7>: Cost 3 vmrglw <4,u,5,u>, <6,6,7,7>
+  2694740325U, // <5,7,u,u>: Cost 3 vsldoi8 <1,6,5,7>, LHS
+  2705358848U, // <5,u,0,0>: Cost 3 vsldoi8 <3,4,5,u>, <0,0,0,0>
+  1631617126U, // <5,u,0,1>: Cost 2 vsldoi8 <3,4,5,u>, LHS
+  2310607866U, // <5,u,0,2>: Cost 3 vmrglw <4,7,5,0>, <7,0,1,2>
+  2302640284U, // <5,u,0,3>: Cost 3 vmrglw <3,4,5,0>, LHS
+  2754238189U, // <5,u,0,4>: Cost 3 vsldoi12 <0,4,1,5>, <u,0,4,1>
+  2305296114U, // <5,u,0,5>: Cost 3 vmrglw <3,u,5,0>, <2,3,u,5>
+  2244907106U, // <5,u,0,6>: Cost 3 vmrghw <5,0,6,1>, <5,6,7,0>
+  2302643528U, // <5,u,0,7>: Cost 3 vmrglw <3,4,5,0>, RHS
+  1631617693U, // <5,u,0,u>: Cost 2 vsldoi8 <3,4,5,u>, LHS
+  2627133542U, // <5,u,1,0>: Cost 3 vsldoi4 <1,5,u,1>, LHS
+  1237536282U, // <5,u,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
+  1680496430U, // <5,u,1,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  1237532828U, // <5,u,1,3>: Cost 2 vmrglw <4,u,5,1>, LHS
+  2693416018U, // <5,u,1,4>: Cost 3 vsldoi8 <1,4,5,u>, <1,4,5,u>
+  2756892486U, // <5,u,1,5>: Cost 3 vsldoi12 <0,u,1,5>, <u,1,5,0>
+  2694743284U, // <5,u,1,6>: Cost 3 vsldoi8 <1,6,5,u>, <1,6,5,u>
+  1237536072U, // <5,u,1,7>: Cost 2 vmrglw <4,u,5,1>, RHS
+  1680496484U, // <5,u,1,u>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  2311288709U, // <5,u,2,0>: Cost 3 vmrglw <4,u,5,2>, <u,2,3,0>
+  2245883694U, // <5,u,2,1>: Cost 3 vmrghw <5,2,1,3>, LHS
+  2699388520U, // <5,u,2,2>: Cost 3 vsldoi8 <2,4,5,u>, <2,2,2,2>
+  2754238344U, // <5,u,2,3>: Cost 3 vsldoi12 <0,4,1,5>, <u,2,3,3>
+  2699388715U, // <5,u,2,4>: Cost 3 vsldoi8 <2,4,5,u>, <2,4,5,u>
+  2757408666U, // <5,u,2,5>: Cost 3 vsldoi12 <0,u,u,5>, <u,2,5,3>
+  2705360826U, // <5,u,2,6>: Cost 3 vsldoi8 <3,4,5,u>, <2,6,3,7>
+  2302659912U, // <5,u,2,7>: Cost 3 vmrglw <3,4,5,2>, RHS
+  2754238389U, // <5,u,2,u>: Cost 3 vsldoi12 <0,4,1,5>, <u,2,u,3>
+  2754238396U, // <5,u,3,0>: Cost 3 vsldoi12 <0,4,1,5>, <u,3,0,1>
   3827980229U, // <5,u,3,1>: Cost 4 vsldoi12 <0,4,1,5>, <u,3,1,1>
-  3718366926U, // <5,u,3,2>: Cost 3 vsldoi4 <4,5,2,3>, <2,3,4,5>
-  3363135644U, // <5,u,3,3>: Cost 3 vmrglw <1,2,5,3>, LHS
-  2705361412U, // <5,u,3,4>: Cost 2 vsldoi8 <3,4,5,u>, <3,4,5,u>
-  3858798573U, // <5,u,3,5>: Cost 3 vsldoi12 <5,5,5,5>, <u,3,5,5>
+  2644625102U, // <5,u,3,2>: Cost 3 vsldoi4 <4,5,2,3>, <2,3,4,5>
+  2289393820U, // <5,u,3,3>: Cost 3 vmrglw <1,2,5,3>, LHS
+  1631619588U, // <5,u,3,4>: Cost 2 vsldoi8 <3,4,5,u>, <3,4,5,u>
+  2785056749U, // <5,u,3,5>: Cost 3 vsldoi12 <5,5,5,5>, <u,3,5,5>
   3363138077U, // <5,u,3,6>: Cost 4 vmrglw <1,2,5,3>, <3,4,u,6>
-  3363138888U, // <5,u,3,7>: Cost 3 vmrglw <1,2,5,3>, RHS
-  2708015944U, // <5,u,3,u>: Cost 2 vsldoi8 <3,u,5,u>, <3,u,5,u>
-  2708679577U, // <5,u,4,0>: Cost 2 vsldoi8 <4,0,5,u>, <4,0,5,u>
-  2802014234U, // <5,u,4,1>: Cost 2 vsldoi12 <u,4,1,5>, <u,4,1,5>
-  3783748667U, // <5,u,4,2>: Cost 3 vsldoi8 <4,2,5,u>, <4,2,5,u>
-  3839481900U, // <5,u,4,3>: Cost 3 vsldoi12 <2,3,4,5>, <u,4,3,5>
-  2711334109U, // <5,u,4,4>: Cost 2 vsldoi8 <4,4,5,u>, <4,4,5,u>
-  2705362230U, // <5,u,4,5>: Cost 2 vsldoi8 <3,4,5,u>, RHS
-  3786403199U, // <5,u,4,6>: Cost 3 vsldoi8 <4,6,5,u>, <4,6,5,u>
-  3376418120U, // <5,u,4,7>: Cost 3 vmrglw <3,4,5,4>, RHS
-  2705362473U, // <5,u,4,u>: Cost 2 vsldoi8 <3,4,5,u>, RHS
-  2650832998U, // <5,u,5,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
-  2248185646U, // <5,u,5,1>: Cost 2 vmrghw <5,5,5,5>, LHS
-  3839776882U, // <5,u,5,2>: Cost 3 vsldoi12 <2,3,u,5>, <u,5,2,3>
-  2311307420U, // <5,u,5,3>: Cost 2 vmrglw <4,u,5,5>, LHS
-  2650836278U, // <5,u,5,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
-  1369886006U, // <5,u,5,5>: Cost 1 vspltisw1 RHS
-  2754238618U, // <5,u,5,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
-  2311310664U, // <5,u,5,7>: Cost 2 vmrglw <4,u,5,5>, RHS
-  1369886006U, // <5,u,5,u>: Cost 1 vspltisw1 RHS
-  3706888294U, // <5,u,6,0>: Cost 3 vsldoi4 <2,5,u,6>, LHS
-  2248955694U, // <5,u,6,1>: Cost 2 vmrghw <5,6,7,0>, LHS
-  3706890133U, // <5,u,6,2>: Cost 3 vsldoi4 <2,5,u,6>, <2,5,u,6>
-  2302689436U, // <5,u,6,3>: Cost 2 vmrglw <3,4,5,6>, LHS
-  3706891574U, // <5,u,6,4>: Cost 3 vsldoi4 <2,5,u,6>, RHS
-  2248956058U, // <5,u,6,5>: Cost 2 vmrghw <5,6,7,0>, RHS
-  2302691842U, // <5,u,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
-  2302692680U, // <5,u,6,7>: Cost 2 vmrglw <3,4,5,6>, RHS
-  2302689441U, // <5,u,6,u>: Cost 2 vmrglw <3,4,5,6>, LHS
-  1571356774U, // <5,u,7,0>: Cost 1 vsldoi4 RHS, LHS
-  2645099316U, // <5,u,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
-  2645100136U, // <5,u,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
-  2645100694U, // <5,u,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
-  1571360072U, // <5,u,7,4>: Cost 1 vsldoi4 RHS, RHS
-  2645102596U, // <5,u,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
-  2645103098U, // <5,u,7,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
-  2645103610U, // <5,u,7,7>: Cost 2 vsldoi4 RHS, <7,0,1,2>
-  1571362606U, // <5,u,7,u>: Cost 1 vsldoi4 RHS, LHS
-  1571364966U, // <5,u,u,0>: Cost 1 vsldoi4 RHS, LHS
-  2705364782U, // <5,u,u,1>: Cost 2 vsldoi8 <3,4,5,u>, LHS
-  2754238821U, // <5,u,u,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
-  2302705820U, // <5,u,u,3>: Cost 2 vmrglw <3,4,5,u>, LHS
-  1571368265U, // <5,u,u,4>: Cost 1 vsldoi4 RHS, RHS
-  1369886006U, // <5,u,u,5>: Cost 1 vspltisw1 RHS
-  2754238861U, // <5,u,u,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
-  2302709064U, // <5,u,u,7>: Cost 2 vmrglw <3,4,5,u>, RHS
-  1571370798U, // <5,u,u,u>: Cost 1 vsldoi4 RHS, LHS
-  3846193152U, // <6,0,0,0>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,0,0>
-  3846193162U, // <6,0,0,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,1,1>
+  2289397064U, // <5,u,3,7>: Cost 3 vmrglw <1,2,5,3>, RHS
+  1634274120U, // <5,u,3,u>: Cost 2 vsldoi8 <3,u,5,u>, <3,u,5,u>
+  1634937753U, // <5,u,4,0>: Cost 2 vsldoi8 <4,0,5,u>, <4,0,5,u>
+  1728272410U, // <5,u,4,1>: Cost 2 vsldoi12 <u,4,1,5>, <u,4,1,5>
+  2710006843U, // <5,u,4,2>: Cost 3 vsldoi8 <4,2,5,u>, <4,2,5,u>
+  2765740076U, // <5,u,4,3>: Cost 3 vsldoi12 <2,3,4,5>, <u,4,3,5>
+  1637592285U, // <5,u,4,4>: Cost 2 vsldoi8 <4,4,5,u>, <4,4,5,u>
+  1631620406U, // <5,u,4,5>: Cost 2 vsldoi8 <3,4,5,u>, RHS
+  2712661375U, // <5,u,4,6>: Cost 3 vsldoi8 <4,6,5,u>, <4,6,5,u>
+  2302676296U, // <5,u,4,7>: Cost 3 vmrglw <3,4,5,4>, RHS
+  1631620649U, // <5,u,4,u>: Cost 2 vsldoi8 <3,4,5,u>, RHS
+  1577091174U, // <5,u,5,0>: Cost 2 vsldoi4 <5,5,5,5>, LHS
+  1174443822U, // <5,u,5,1>: Cost 2 vmrghw <5,5,5,5>, LHS
+  2766035058U, // <5,u,5,2>: Cost 3 vsldoi12 <2,3,u,5>, <u,5,2,3>
+  1237565596U, // <5,u,5,3>: Cost 2 vmrglw <4,u,5,5>, LHS
+  1577094454U, // <5,u,5,4>: Cost 2 vsldoi4 <5,5,5,5>, RHS
+  296144182U,  // <5,u,5,5>: Cost 1 vspltisw1 RHS
+  1680496794U, // <5,u,5,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  1237568840U, // <5,u,5,7>: Cost 2 vmrglw <4,u,5,5>, RHS
+  296144182U,  // <5,u,5,u>: Cost 1 vspltisw1 RHS
+  2633146470U, // <5,u,6,0>: Cost 3 vsldoi4 <2,5,u,6>, LHS
+  1175213870U, // <5,u,6,1>: Cost 2 vmrghw <5,6,7,0>, LHS
+  2633148309U, // <5,u,6,2>: Cost 3 vsldoi4 <2,5,u,6>, <2,5,u,6>
+  1228947612U, // <5,u,6,3>: Cost 2 vmrglw <3,4,5,6>, LHS
+  2633149750U, // <5,u,6,4>: Cost 3 vsldoi4 <2,5,u,6>, RHS
+  1175214234U, // <5,u,6,5>: Cost 2 vmrghw <5,6,7,0>, RHS
+  1228950018U, // <5,u,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
+  1228950856U, // <5,u,6,7>: Cost 2 vmrglw <3,4,5,6>, RHS
+  1228947617U, // <5,u,6,u>: Cost 2 vmrglw <3,4,5,6>, LHS
+  497614950U,  // <5,u,7,0>: Cost 1 vsldoi4 RHS, LHS
+  1571357492U, // <5,u,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
+  1571358312U, // <5,u,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
+  1571358870U, // <5,u,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
+  497618248U,  // <5,u,7,4>: Cost 1 vsldoi4 RHS, RHS
+  1571360772U, // <5,u,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
+  1571361274U, // <5,u,7,6>: Cost 2 vsldoi4 RHS, <6,2,7,3>
+  1571361786U, // <5,u,7,7>: Cost 2 vsldoi4 RHS, <7,0,1,2>
+  497620782U,  // <5,u,7,u>: Cost 1 vsldoi4 RHS, LHS
+  497623142U,  // <5,u,u,0>: Cost 1 vsldoi4 RHS, LHS
+  1631622958U, // <5,u,u,1>: Cost 2 vsldoi8 <3,4,5,u>, LHS
+  1680496997U, // <5,u,u,2>: Cost 2 vsldoi12 <0,4,1,5>, LHS
+  1228963996U, // <5,u,u,3>: Cost 2 vmrglw <3,4,5,u>, LHS
+  497626441U,  // <5,u,u,4>: Cost 1 vsldoi4 RHS, RHS
+  296144182U,  // <5,u,u,5>: Cost 1 vspltisw1 RHS
+  1680497037U, // <5,u,u,6>: Cost 2 vsldoi12 <0,4,1,5>, RHS
+  1228967240U, // <5,u,u,7>: Cost 2 vmrglw <3,4,5,u>, RHS
+  497628974U,  // <5,u,u,u>: Cost 1 vsldoi4 RHS, LHS
+  2772451328U, // <6,0,0,0>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,0,0>
+  2772451338U, // <6,0,0,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,1,1>
   3771146417U, // <6,0,0,2>: Cost 4 vsldoi8 <2,1,6,0>, <0,2,1,6>
   3383095739U, // <6,0,0,3>: Cost 4 vmrglw <4,5,6,0>, <6,2,0,3>
   3846193189U, // <6,0,0,4>: Cost 4 vsldoi12 <3,4,5,6>, <0,0,4,1>
   3724832803U, // <6,0,0,5>: Cost 4 vsldoi4 <5,6,0,0>, <5,6,0,0>
   3383095985U, // <6,0,0,6>: Cost 4 vmrglw <4,5,6,0>, <6,5,0,6>
   3383096067U, // <6,0,0,7>: Cost 4 vmrglw <4,5,6,0>, <6,6,0,7>
-  3846193225U, // <6,0,0,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,u,1>
-  3724836966U, // <6,0,1,0>: Cost 3 vsldoi4 <5,6,0,1>, LHS
-  3325354086U, // <6,0,1,1>: Cost 3 vmrghw <6,1,7,1>, LHS
-  2772451430U, // <6,0,1,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
-  3724839426U, // <6,0,1,3>: Cost 3 vsldoi4 <5,6,0,1>, <3,4,5,6>
-  3724840246U, // <6,0,1,4>: Cost 3 vsldoi4 <5,6,0,1>, RHS
-  3724840996U, // <6,0,1,5>: Cost 3 vsldoi4 <5,6,0,1>, <5,6,0,1>
-  3730813693U, // <6,0,1,6>: Cost 3 vsldoi4 <6,6,0,1>, <6,6,0,1>
+  2772451401U, // <6,0,0,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,0,u,1>
+  2651095142U, // <6,0,1,0>: Cost 3 vsldoi4 <5,6,0,1>, LHS
+  2251612262U, // <6,0,1,1>: Cost 3 vmrghw <6,1,7,1>, LHS
+  1698709606U, // <6,0,1,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2651097602U, // <6,0,1,3>: Cost 3 vsldoi4 <5,6,0,1>, <3,4,5,6>
+  2651098422U, // <6,0,1,4>: Cost 3 vsldoi4 <5,6,0,1>, RHS
+  2651099172U, // <6,0,1,5>: Cost 3 vsldoi4 <5,6,0,1>, <5,6,0,1>
+  2657071869U, // <6,0,1,6>: Cost 3 vsldoi4 <6,6,0,1>, <6,6,0,1>
   3724841978U, // <6,0,1,7>: Cost 4 vsldoi4 <5,6,0,1>, <7,0,1,2>
-  2772451484U, // <6,0,1,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
-  3326033920U, // <6,0,2,0>: Cost 3 vmrghw <6,2,7,3>, <0,0,0,0>
-  2252292198U, // <6,0,2,1>: Cost 2 vmrghw <6,2,7,3>, LHS
+  1698709660U, // <6,0,1,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2252292096U, // <6,0,2,0>: Cost 3 vmrghw <6,2,7,3>, <0,0,0,0>
+  1178550374U, // <6,0,2,1>: Cost 2 vmrghw <6,2,7,3>, LHS
   3826655418U, // <6,0,2,2>: Cost 4 vsldoi12 <0,2,1,6>, <0,2,2,6>
   3777783485U, // <6,0,2,3>: Cost 4 vsldoi8 <3,2,6,0>, <2,3,2,6>
-  3326034258U, // <6,0,2,4>: Cost 3 vmrghw <6,2,7,3>, <0,4,1,5>
+  2252292434U, // <6,0,2,4>: Cost 3 vmrghw <6,2,7,3>, <0,4,1,5>
   3785746280U, // <6,0,2,5>: Cost 4 vsldoi8 <4,5,6,0>, <2,5,3,6>
-  3326034417U, // <6,0,2,6>: Cost 3 vmrghw <6,2,7,3>, <0,6,1,2>
+  2252292593U, // <6,0,2,6>: Cost 3 vmrghw <6,2,7,3>, <0,6,1,2>
   3736794583U, // <6,0,2,7>: Cost 4 vsldoi4 <7,6,0,2>, <7,6,0,2>
-  2252292765U, // <6,0,2,u>: Cost 2 vmrghw <6,2,7,3>, LHS
+  1178550941U, // <6,0,2,u>: Cost 2 vmrghw <6,2,7,3>, LHS
   3375153152U, // <6,0,3,0>: Cost 4 vmrglw <3,2,6,3>, <0,0,0,0>
-  3846193408U, // <6,0,3,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,3,1,4>
+  2772451584U, // <6,0,3,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,3,1,4>
   3777784163U, // <6,0,3,2>: Cost 4 vsldoi8 <3,2,6,0>, <3,2,6,0>
   3846193426U, // <6,0,3,3>: Cost 4 vsldoi12 <3,4,5,6>, <0,3,3,4>
-  3785746946U, // <6,0,3,4>: Cost 3 vsldoi8 <4,5,6,0>, <3,4,5,6>
+  2712005122U, // <6,0,3,4>: Cost 3 vsldoi8 <4,5,6,0>, <3,4,5,6>
   3724857382U, // <6,0,3,5>: Cost 4 vsldoi4 <5,6,0,3>, <5,6,0,3>
   3802335864U, // <6,0,3,6>: Cost 4 vsldoi8 <7,3,6,0>, <3,6,0,7>
   3801672410U, // <6,0,3,7>: Cost 4 vsldoi8 <7,2,6,0>, <3,7,2,6>
-  3846193471U, // <6,0,3,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,3,u,4>
+  2772451647U, // <6,0,3,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,3,u,4>
   3383123968U, // <6,0,4,0>: Cost 4 vmrglw <4,5,6,4>, <0,0,0,0>
-  3846193490U, // <6,0,4,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,4,1,5>
+  2772451666U, // <6,0,4,1>: Cost 3 vsldoi12 <3,4,5,6>, <0,4,1,5>
   3773803577U, // <6,0,4,2>: Cost 4 vsldoi8 <2,5,6,0>, <4,2,5,6>
   3724864002U, // <6,0,4,3>: Cost 4 vsldoi4 <5,6,0,4>, <3,4,5,6>
   3846193517U, // <6,0,4,4>: Cost 4 vsldoi12 <3,4,5,6>, <0,4,4,5>
-  3785747759U, // <6,0,4,5>: Cost 3 vsldoi8 <4,5,6,0>, <4,5,6,0>
+  2712005935U, // <6,0,4,5>: Cost 3 vsldoi8 <4,5,6,0>, <4,5,6,0>
   3327009265U, // <6,0,4,6>: Cost 4 vmrghw <6,4,2,5>, <0,6,1,2>
   3383126648U, // <6,0,4,7>: Cost 5 vmrglw <4,5,6,4>, <3,6,0,7>
-  3846193553U, // <6,0,4,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,4,u,5>
+  2772451729U, // <6,0,4,u>: Cost 3 vsldoi12 <3,4,5,6>, <0,4,u,5>
   3373178880U, // <6,0,5,0>: Cost 4 vmrglw <2,u,6,5>, <0,0,0,0>
-  3328008294U, // <6,0,5,1>: Cost 3 vmrghw <6,5,7,1>, LHS
+  2254266470U, // <6,0,5,1>: Cost 3 vmrghw <6,5,7,1>, LHS
   3785748248U, // <6,0,5,2>: Cost 4 vsldoi8 <4,5,6,0>, <5,2,6,3>
   3790393190U, // <6,0,5,3>: Cost 4 vsldoi8 <5,3,6,0>, <5,3,6,0>
   3328000338U, // <6,0,5,4>: Cost 4 vmrghw <6,5,7,0>, <0,4,1,5>
   3785748494U, // <6,0,5,5>: Cost 4 vsldoi8 <4,5,6,0>, <5,5,6,6>
   3785748516U, // <6,0,5,6>: Cost 4 vsldoi8 <4,5,6,0>, <5,6,0,1>
   3379153528U, // <6,0,5,7>: Cost 4 vmrglw <3,u,6,5>, <3,6,0,7>
-  3328008861U, // <6,0,5,u>: Cost 3 vmrghw <6,5,7,1>, LHS
-  3328638976U, // <6,0,6,0>: Cost 3 vmrghw <6,6,6,6>, <0,0,0,0>
-  2254897254U, // <6,0,6,1>: Cost 2 vmrghw <6,6,6,6>, LHS
+  2254267037U, // <6,0,5,u>: Cost 3 vmrghw <6,5,7,1>, LHS
+  2254897152U, // <6,0,6,0>: Cost 3 vmrghw <6,6,6,6>, <0,0,0,0>
+  1181155430U, // <6,0,6,1>: Cost 2 vmrghw <6,6,6,6>, LHS
   3785748923U, // <6,0,6,2>: Cost 4 vsldoi8 <4,5,6,0>, <6,2,0,3>
   3785749042U, // <6,0,6,3>: Cost 4 vsldoi8 <4,5,6,0>, <6,3,4,5>
-  3328639314U, // <6,0,6,4>: Cost 3 vmrghw <6,6,6,6>, <0,4,1,5>
+  2254897490U, // <6,0,6,4>: Cost 3 vmrghw <6,6,6,6>, <0,4,1,5>
   3785749169U, // <6,0,6,5>: Cost 4 vsldoi8 <4,5,6,0>, <6,5,0,6>
-  3798356786U, // <6,0,6,6>: Cost 3 vsldoi8 <6,6,6,0>, <6,6,6,0>
+  2724614962U, // <6,0,6,6>: Cost 3 vsldoi8 <6,6,6,0>, <6,6,6,0>
   3787739982U, // <6,0,6,7>: Cost 4 vsldoi8 <4,u,6,0>, <6,7,0,1>
-  2254897821U, // <6,0,6,u>: Cost 2 vmrghw <6,6,6,6>, LHS
-  2309406720U, // <6,0,7,0>: Cost 2 vmrglw RHS, <0,0,0,0>
-  2309408422U, // <6,0,7,1>: Cost 2 vmrglw RHS, <2,3,0,1>
+  1181155997U, // <6,0,6,u>: Cost 2 vmrghw <6,6,6,6>, LHS
+  1235664896U, // <6,0,7,0>: Cost 2 vmrglw RHS, <0,0,0,0>
+  1235666598U, // <6,0,7,1>: Cost 2 vmrglw RHS, <2,3,0,1>
   3712943720U, // <6,0,7,2>: Cost 4 vsldoi4 <3,6,0,7>, <2,2,2,2>
-  3712944760U, // <6,0,7,3>: Cost 3 vsldoi4 <3,6,0,7>, <3,6,0,7>
-  3712945462U, // <6,0,7,4>: Cost 3 vsldoi4 <3,6,0,7>, RHS
-  3383151060U, // <6,0,7,5>: Cost 3 vmrglw RHS, <3,4,0,5>
+  2639202936U, // <6,0,7,3>: Cost 3 vsldoi4 <3,6,0,7>, <3,6,0,7>
+  2639203638U, // <6,0,7,4>: Cost 3 vsldoi4 <3,6,0,7>, RHS
+  2309409236U, // <6,0,7,5>: Cost 3 vmrglw RHS, <3,4,0,5>
   3712946517U, // <6,0,7,6>: Cost 4 vsldoi4 <3,6,0,7>, <6,0,7,0>
-  3383151224U, // <6,0,7,7>: Cost 3 vmrglw RHS, <3,6,0,7>
-  2309408429U, // <6,0,7,u>: Cost 2 vmrglw RHS, <2,3,0,u>
-  2309414912U, // <6,0,u,0>: Cost 2 vmrglw RHS, <0,0,0,0>
-  2309416614U, // <6,0,u,1>: Cost 2 vmrglw RHS, <2,3,0,1>
-  2772451997U, // <6,0,u,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
-  3712952953U, // <6,0,u,3>: Cost 3 vsldoi4 <3,6,0,u>, <3,6,0,u>
-  3712953654U, // <6,0,u,4>: Cost 3 vsldoi4 <3,6,0,u>, RHS
-  3785750682U, // <6,0,u,5>: Cost 3 vsldoi8 <4,5,6,0>, RHS
-  3730871044U, // <6,0,u,6>: Cost 3 vsldoi4 <6,6,0,u>, <6,6,0,u>
-  3383159416U, // <6,0,u,7>: Cost 3 vmrglw RHS, <3,6,0,7>
-  2772452051U, // <6,0,u,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2309409400U, // <6,0,7,7>: Cost 3 vmrglw RHS, <3,6,0,7>
+  1235666605U, // <6,0,7,u>: Cost 2 vmrglw RHS, <2,3,0,u>
+  1235673088U, // <6,0,u,0>: Cost 2 vmrglw RHS, <0,0,0,0>
+  1235674790U, // <6,0,u,1>: Cost 2 vmrglw RHS, <2,3,0,1>
+  1698710173U, // <6,0,u,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2639211129U, // <6,0,u,3>: Cost 3 vsldoi4 <3,6,0,u>, <3,6,0,u>
+  2639211830U, // <6,0,u,4>: Cost 3 vsldoi4 <3,6,0,u>, RHS
+  2712008858U, // <6,0,u,5>: Cost 3 vsldoi8 <4,5,6,0>, RHS
+  2657129220U, // <6,0,u,6>: Cost 3 vsldoi4 <6,6,0,u>, <6,6,0,u>
+  2309417592U, // <6,0,u,7>: Cost 3 vmrglw RHS, <3,6,0,7>
+  1698710227U, // <6,0,u,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
   3775799296U, // <6,1,0,0>: Cost 4 vsldoi8 <2,u,6,1>, <0,0,0,0>
-  3775799398U, // <6,1,0,1>: Cost 3 vsldoi8 <2,u,6,1>, LHS
+  2702057574U, // <6,1,0,1>: Cost 3 vsldoi8 <2,u,6,1>, LHS
   3373143763U, // <6,1,0,2>: Cost 4 vmrglw <2,u,6,0>, <u,0,1,2>
   3695045122U, // <6,1,0,3>: Cost 4 vsldoi4 <0,6,1,0>, <3,4,5,6>
   3775799634U, // <6,1,0,4>: Cost 4 vsldoi8 <2,u,6,1>, <0,4,1,5>
   3383091538U, // <6,1,0,5>: Cost 4 vmrglw <4,5,6,0>, <0,4,1,5>
   3368493233U, // <6,1,0,6>: Cost 4 vmrglw <2,1,6,0>, <0,2,1,6>
   3362522319U, // <6,1,0,7>: Cost 5 vmrglw <1,1,6,0>, <1,6,1,7>
-  3775799965U, // <6,1,0,u>: Cost 3 vsldoi8 <2,u,6,1>, LHS
+  2702058141U, // <6,1,0,u>: Cost 3 vsldoi8 <2,u,6,1>, LHS
   3834250027U, // <6,1,1,0>: Cost 4 vsldoi12 <1,4,5,6>, <1,1,0,1>
-  3846193972U, // <6,1,1,1>: Cost 3 vsldoi12 <3,4,5,6>, <1,1,1,1>
+  2772452148U, // <6,1,1,1>: Cost 3 vsldoi12 <3,4,5,6>, <1,1,1,1>
   3832038210U, // <6,1,1,2>: Cost 4 vsldoi12 <1,1,2,6>, <1,1,2,6>
   3373150660U, // <6,1,1,3>: Cost 4 vmrglw <2,u,6,1>, <6,2,1,3>
   3834250067U, // <6,1,1,4>: Cost 4 vsldoi12 <1,4,5,6>, <1,1,4,5>
   3373146450U, // <6,1,1,5>: Cost 4 vmrglw <2,u,6,1>, <0,4,1,5>
   3826656102U, // <6,1,1,6>: Cost 4 vsldoi12 <0,2,1,6>, <1,1,6,6>
   3362530511U, // <6,1,1,7>: Cost 4 vmrglw <1,1,6,1>, <1,6,1,7>
-  3846193972U, // <6,1,1,u>: Cost 3 vsldoi12 <3,4,5,6>, <1,1,1,1>
-  3742834790U, // <6,1,2,0>: Cost 3 vsldoi4 <u,6,1,2>, LHS
-  3326034740U, // <6,1,2,1>: Cost 3 vmrghw <6,2,7,3>, <1,1,1,1>
-  3326034838U, // <6,1,2,2>: Cost 3 vmrghw <6,2,7,3>, <1,2,3,0>
-  3846194070U, // <6,1,2,3>: Cost 3 vsldoi12 <3,4,5,6>, <1,2,3,0>
-  3742838070U, // <6,1,2,4>: Cost 3 vsldoi4 <u,6,1,2>, RHS
+  2772452148U, // <6,1,1,u>: Cost 3 vsldoi12 <3,4,5,6>, <1,1,1,1>
+  2669092966U, // <6,1,2,0>: Cost 3 vsldoi4 <u,6,1,2>, LHS
+  2252292916U, // <6,1,2,1>: Cost 3 vmrghw <6,2,7,3>, <1,1,1,1>
+  2252293014U, // <6,1,2,2>: Cost 3 vmrghw <6,2,7,3>, <1,2,3,0>
+  2772452246U, // <6,1,2,3>: Cost 3 vsldoi12 <3,4,5,6>, <1,2,3,0>
+  2669096246U, // <6,1,2,4>: Cost 3 vsldoi4 <u,6,1,2>, RHS
   3846194091U, // <6,1,2,5>: Cost 4 vsldoi12 <3,4,5,6>, <1,2,5,3>
-  3775801274U, // <6,1,2,6>: Cost 3 vsldoi8 <2,u,6,1>, <2,6,3,7>
+  2702059450U, // <6,1,2,6>: Cost 3 vsldoi8 <2,u,6,1>, <2,6,3,7>
   3870081978U, // <6,1,2,7>: Cost 4 vsldoi12 <7,4,5,6>, <1,2,7,0>
-  3775801457U, // <6,1,2,u>: Cost 3 vsldoi8 <2,u,6,1>, <2,u,6,1>
+  2702059633U, // <6,1,2,u>: Cost 3 vsldoi8 <2,u,6,1>, <2,u,6,1>
   3775801494U, // <6,1,3,0>: Cost 4 vsldoi8 <2,u,6,1>, <3,0,1,2>
   3777128723U, // <6,1,3,1>: Cost 4 vsldoi8 <3,1,6,1>, <3,1,6,1>
   3775801702U, // <6,1,3,2>: Cost 4 vsldoi8 <2,u,6,1>, <3,2,6,3>
@@ -4517,298 +4517,298 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3846194228U, // <6,1,4,2>: Cost 4 vsldoi12 <3,4,5,6>, <1,4,2,5>
   3846194236U, // <6,1,4,3>: Cost 4 vsldoi12 <3,4,5,6>, <1,4,3,4>
   3846194246U, // <6,1,4,4>: Cost 4 vsldoi12 <3,4,5,6>, <1,4,4,5>
-  3834250320U, // <6,1,4,5>: Cost 3 vsldoi12 <1,4,5,6>, <1,4,5,6>
+  2760508496U, // <6,1,4,5>: Cost 3 vsldoi12 <1,4,5,6>, <1,4,5,6>
   3368526001U, // <6,1,4,6>: Cost 4 vmrglw <2,1,6,4>, <0,2,1,6>
   3870082144U, // <6,1,4,7>: Cost 4 vsldoi12 <7,4,5,6>, <1,4,7,4>
-  3834471531U, // <6,1,4,u>: Cost 3 vsldoi12 <1,4,u,6>, <1,4,u,6>
-  3788410484U, // <6,1,5,0>: Cost 3 vsldoi8 <5,0,6,1>, <5,0,6,1>
+  2760729707U, // <6,1,4,u>: Cost 3 vsldoi12 <1,4,u,6>, <1,4,u,6>
+  2714668660U, // <6,1,5,0>: Cost 3 vsldoi8 <5,0,6,1>, <5,0,6,1>
   3834619005U, // <6,1,5,1>: Cost 4 vsldoi12 <1,5,1,6>, <1,5,1,6>
   3834692742U, // <6,1,5,2>: Cost 4 vsldoi12 <1,5,2,6>, <1,5,2,6>
   3846194317U, // <6,1,5,3>: Cost 4 vsldoi12 <3,4,5,6>, <1,5,3,4>
   3834840216U, // <6,1,5,4>: Cost 4 vsldoi12 <1,5,4,6>, <1,5,4,6>
   3834913953U, // <6,1,5,5>: Cost 4 vsldoi12 <1,5,5,6>, <1,5,5,6>
-  3793719394U, // <6,1,5,6>: Cost 3 vsldoi8 <5,u,6,1>, <5,6,7,0>
+  2719977570U, // <6,1,5,6>: Cost 3 vsldoi8 <5,u,6,1>, <5,6,7,0>
   3367208143U, // <6,1,5,7>: Cost 4 vmrglw <1,u,6,5>, <1,6,1,7>
-  3793719548U, // <6,1,5,u>: Cost 3 vsldoi8 <5,u,6,1>, <5,u,6,1>
-  3742867558U, // <6,1,6,0>: Cost 3 vsldoi4 <u,6,1,6>, LHS
-  3328639796U, // <6,1,6,1>: Cost 3 vmrghw <6,6,6,6>, <1,1,1,1>
-  3328639894U, // <6,1,6,2>: Cost 3 vmrghw <6,6,6,6>, <1,2,3,0>
+  2719977724U, // <6,1,5,u>: Cost 3 vsldoi8 <5,u,6,1>, <5,u,6,1>
+  2669125734U, // <6,1,6,0>: Cost 3 vsldoi4 <u,6,1,6>, LHS
+  2254897972U, // <6,1,6,1>: Cost 3 vmrghw <6,6,6,6>, <1,1,1,1>
+  2254898070U, // <6,1,6,2>: Cost 3 vmrghw <6,6,6,6>, <1,2,3,0>
   3775803929U, // <6,1,6,3>: Cost 4 vsldoi8 <2,u,6,1>, <6,3,1,7>
-  3742870838U, // <6,1,6,4>: Cost 3 vsldoi4 <u,6,1,6>, RHS
-  3395748178U, // <6,1,6,5>: Cost 3 vmrglw <6,6,6,6>, <0,4,1,5>
-  3799692088U, // <6,1,6,6>: Cost 3 vsldoi8 <6,u,6,1>, <6,6,6,6>
+  2669129014U, // <6,1,6,4>: Cost 3 vsldoi4 <u,6,1,6>, RHS
+  2322006354U, // <6,1,6,5>: Cost 3 vmrglw <6,6,6,6>, <0,4,1,5>
+  2725950264U, // <6,1,6,6>: Cost 3 vsldoi8 <6,u,6,1>, <6,6,6,6>
   3793720142U, // <6,1,6,7>: Cost 4 vsldoi8 <5,u,6,1>, <6,7,0,1>
-  3328640380U, // <6,1,6,u>: Cost 3 vmrghw <6,6,6,6>, <1,u,3,0>
-  3701071974U, // <6,1,7,0>: Cost 3 vsldoi4 <1,6,1,7>, LHS
-  2309406730U, // <6,1,7,1>: Cost 2 vmrglw RHS, <0,0,1,1>
-  2309408918U, // <6,1,7,2>: Cost 2 vmrglw RHS, <3,0,1,2>
-  3383148718U, // <6,1,7,3>: Cost 3 vmrglw RHS, <0,2,1,3>
-  3701075254U, // <6,1,7,4>: Cost 3 vsldoi4 <1,6,1,7>, RHS
-  2309407058U, // <6,1,7,5>: Cost 2 vmrglw RHS, <0,4,1,5>
-  3383148721U, // <6,1,7,6>: Cost 3 vmrglw RHS, <0,2,1,6>
-  3383149046U, // <6,1,7,7>: Cost 3 vmrglw RHS, <0,6,1,7>
-  2309406737U, // <6,1,7,u>: Cost 2 vmrglw RHS, <0,0,1,u>
-  3701080166U, // <6,1,u,0>: Cost 3 vsldoi4 <1,6,1,u>, LHS
-  2309414922U, // <6,1,u,1>: Cost 2 vmrglw RHS, <0,0,1,1>
-  2309417110U, // <6,1,u,2>: Cost 2 vmrglw RHS, <3,0,1,2>
-  3846194556U, // <6,1,u,3>: Cost 3 vsldoi12 <3,4,5,6>, <1,u,3,0>
-  3701083446U, // <6,1,u,4>: Cost 3 vsldoi4 <1,6,1,u>, RHS
-  2309415250U, // <6,1,u,5>: Cost 2 vmrglw RHS, <0,4,1,5>
-  3383156913U, // <6,1,u,6>: Cost 3 vmrglw RHS, <0,2,1,6>
-  3383157238U, // <6,1,u,7>: Cost 3 vmrglw RHS, <0,6,1,7>
-  2309414929U, // <6,1,u,u>: Cost 2 vmrglw RHS, <0,0,1,u>
+  2254898556U, // <6,1,6,u>: Cost 3 vmrghw <6,6,6,6>, <1,u,3,0>
+  2627330150U, // <6,1,7,0>: Cost 3 vsldoi4 <1,6,1,7>, LHS
+  1235664906U, // <6,1,7,1>: Cost 2 vmrglw RHS, <0,0,1,1>
+  1235667094U, // <6,1,7,2>: Cost 2 vmrglw RHS, <3,0,1,2>
+  2309406894U, // <6,1,7,3>: Cost 3 vmrglw RHS, <0,2,1,3>
+  2627333430U, // <6,1,7,4>: Cost 3 vsldoi4 <1,6,1,7>, RHS
+  1235665234U, // <6,1,7,5>: Cost 2 vmrglw RHS, <0,4,1,5>
+  2309406897U, // <6,1,7,6>: Cost 3 vmrglw RHS, <0,2,1,6>
+  2309407222U, // <6,1,7,7>: Cost 3 vmrglw RHS, <0,6,1,7>
+  1235664913U, // <6,1,7,u>: Cost 2 vmrglw RHS, <0,0,1,u>
+  2627338342U, // <6,1,u,0>: Cost 3 vsldoi4 <1,6,1,u>, LHS
+  1235673098U, // <6,1,u,1>: Cost 2 vmrglw RHS, <0,0,1,1>
+  1235675286U, // <6,1,u,2>: Cost 2 vmrglw RHS, <3,0,1,2>
+  2772452732U, // <6,1,u,3>: Cost 3 vsldoi12 <3,4,5,6>, <1,u,3,0>
+  2627341622U, // <6,1,u,4>: Cost 3 vsldoi4 <1,6,1,u>, RHS
+  1235673426U, // <6,1,u,5>: Cost 2 vmrglw RHS, <0,4,1,5>
+  2309415089U, // <6,1,u,6>: Cost 3 vmrglw RHS, <0,2,1,6>
+  2309415414U, // <6,1,u,7>: Cost 3 vmrglw RHS, <0,6,1,7>
+  1235673105U, // <6,1,u,u>: Cost 2 vmrglw RHS, <0,0,1,u>
   3324683725U, // <6,2,0,0>: Cost 4 vmrghw <6,0,7,0>, <2,0,3,0>
-  3799031910U, // <6,2,0,1>: Cost 3 vsldoi8 <6,7,6,2>, LHS
+  2725290086U, // <6,2,0,1>: Cost 3 vsldoi8 <6,7,6,2>, LHS
   3771162801U, // <6,2,0,2>: Cost 4 vsldoi8 <2,1,6,2>, <0,2,1,6>
-  3383091302U, // <6,2,0,3>: Cost 3 vmrglw <4,5,6,0>, LHS
+  2309349478U, // <6,2,0,3>: Cost 3 vmrglw <4,5,6,0>, LHS
   3730951478U, // <6,2,0,4>: Cost 4 vsldoi4 <6,6,2,0>, RHS
   3840738784U, // <6,2,0,5>: Cost 4 vsldoi12 <2,5,3,6>, <2,0,5,1>
   3842655721U, // <6,2,0,6>: Cost 4 vsldoi12 <2,u,2,6>, <2,0,6,1>
   3736925671U, // <6,2,0,7>: Cost 4 vsldoi4 <7,6,2,0>, <7,6,2,0>
-  3383091307U, // <6,2,0,u>: Cost 3 vmrglw <4,5,6,0>, LHS
+  2309349483U, // <6,2,0,u>: Cost 3 vmrglw <4,5,6,0>, LHS
   3367840468U, // <6,2,1,0>: Cost 4 vmrglw <2,0,6,1>, <3,7,2,0>
   3325355551U, // <6,2,1,1>: Cost 4 vmrghw <6,1,7,1>, <2,1,3,1>
   3373147752U, // <6,2,1,2>: Cost 4 vmrglw <2,u,6,1>, <2,2,2,2>
-  3373146214U, // <6,2,1,3>: Cost 3 vmrglw <2,u,6,1>, LHS
+  2299404390U, // <6,2,1,3>: Cost 3 vmrglw <2,u,6,1>, LHS
   3701099830U, // <6,2,1,4>: Cost 5 vsldoi4 <1,6,2,1>, RHS
   3767846054U, // <6,2,1,5>: Cost 4 vsldoi8 <1,5,6,2>, <1,5,6,2>
   3826656825U, // <6,2,1,6>: Cost 4 vsldoi12 <0,2,1,6>, <2,1,6,0>
   3373147838U, // <6,2,1,7>: Cost 5 vmrglw <2,u,6,1>, <2,3,2,7>
-  3373146219U, // <6,2,1,u>: Cost 3 vmrglw <2,u,6,1>, LHS
-  3730964582U, // <6,2,2,0>: Cost 3 vsldoi4 <6,6,2,2>, LHS
+  2299404395U, // <6,2,1,u>: Cost 3 vmrglw <2,u,6,1>, LHS
+  2657222758U, // <6,2,2,0>: Cost 3 vsldoi4 <6,6,2,2>, LHS
   3771164219U, // <6,2,2,1>: Cost 4 vsldoi8 <2,1,6,2>, <2,1,6,2>
-  3840222824U, // <6,2,2,2>: Cost 3 vsldoi12 <2,4,5,6>, <2,2,2,2>
-  3846194802U, // <6,2,2,3>: Cost 3 vsldoi12 <3,4,5,6>, <2,2,3,3>
-  3730967862U, // <6,2,2,4>: Cost 3 vsldoi4 <6,6,2,2>, RHS
+  2766481000U, // <6,2,2,2>: Cost 3 vsldoi12 <2,4,5,6>, <2,2,2,2>
+  2772452978U, // <6,2,2,3>: Cost 3 vsldoi12 <3,4,5,6>, <2,2,3,3>
+  2657226038U, // <6,2,2,4>: Cost 3 vsldoi4 <6,6,2,2>, RHS
   3790407528U, // <6,2,2,5>: Cost 4 vsldoi8 <5,3,6,2>, <2,5,3,6>
-  3326035898U, // <6,2,2,6>: Cost 3 vmrghw <6,2,7,3>, <2,6,3,7>
-  3326035972U, // <6,2,2,7>: Cost 3 vmrghw <6,2,7,3>, <2,7,3,0>
-  3846194847U, // <6,2,2,u>: Cost 3 vsldoi12 <3,4,5,6>, <2,2,u,3>
-  3846194854U, // <6,2,3,0>: Cost 3 vsldoi12 <3,4,5,6>, <2,3,0,1>
+  2252294074U, // <6,2,2,6>: Cost 3 vmrghw <6,2,7,3>, <2,6,3,7>
+  2252294148U, // <6,2,2,7>: Cost 3 vmrghw <6,2,7,3>, <2,7,3,0>
+  2772453023U, // <6,2,2,u>: Cost 3 vsldoi12 <3,4,5,6>, <2,2,u,3>
+  2772453030U, // <6,2,3,0>: Cost 3 vsldoi12 <3,4,5,6>, <2,3,0,1>
   3834250930U, // <6,2,3,1>: Cost 4 vsldoi12 <1,4,5,6>, <2,3,1,4>
-  3839338173U, // <6,2,3,2>: Cost 3 vsldoi12 <2,3,2,6>, <2,3,2,6>
-  3375153254U, // <6,2,3,3>: Cost 3 vmrglw <3,2,6,3>, LHS
-  3846194894U, // <6,2,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <2,3,4,5>
-  3839559384U, // <6,2,3,5>: Cost 3 vsldoi12 <2,3,5,6>, <2,3,5,6>
-  3326674874U, // <6,2,3,6>: Cost 3 vmrghw <6,3,7,0>, <2,6,3,7>
-  3870082792U, // <6,2,3,7>: Cost 3 vsldoi12 <7,4,5,6>, <2,3,7,4>
-  3839780595U, // <6,2,3,u>: Cost 3 vsldoi12 <2,3,u,6>, <2,3,u,6>
+  2765596349U, // <6,2,3,2>: Cost 3 vsldoi12 <2,3,2,6>, <2,3,2,6>
+  2301411430U, // <6,2,3,3>: Cost 3 vmrglw <3,2,6,3>, LHS
+  2772453070U, // <6,2,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <2,3,4,5>
+  2765817560U, // <6,2,3,5>: Cost 3 vsldoi12 <2,3,5,6>, <2,3,5,6>
+  2252933050U, // <6,2,3,6>: Cost 3 vmrghw <6,3,7,0>, <2,6,3,7>
+  2796340968U, // <6,2,3,7>: Cost 3 vsldoi12 <7,4,5,6>, <2,3,7,4>
+  2766038771U, // <6,2,3,u>: Cost 3 vsldoi12 <2,3,u,6>, <2,3,u,6>
   3725008998U, // <6,2,4,0>: Cost 4 vsldoi4 <5,6,2,4>, LHS
   3368530217U, // <6,2,4,1>: Cost 5 vmrglw <2,1,6,4>, <6,0,2,1>
   3840222989U, // <6,2,4,2>: Cost 4 vsldoi12 <2,4,5,6>, <2,4,2,5>
-  3383124070U, // <6,2,4,3>: Cost 3 vmrglw <4,5,6,4>, LHS
+  2309382246U, // <6,2,4,3>: Cost 3 vmrglw <4,5,6,4>, LHS
   3725012278U, // <6,2,4,4>: Cost 4 vsldoi4 <5,6,2,4>, RHS
-  3840223017U, // <6,2,4,5>: Cost 3 vsldoi12 <2,4,5,6>, <2,4,5,6>
+  2766481193U, // <6,2,4,5>: Cost 3 vsldoi12 <2,4,5,6>, <2,4,5,6>
   3842656049U, // <6,2,4,6>: Cost 4 vsldoi12 <2,u,2,6>, <2,4,6,5>
   3327010820U, // <6,2,4,7>: Cost 4 vmrghw <6,4,2,5>, <2,7,3,0>
-  3840444228U, // <6,2,4,u>: Cost 3 vsldoi12 <2,4,u,6>, <2,4,u,6>
+  2766702404U, // <6,2,4,u>: Cost 3 vsldoi12 <2,4,u,6>, <2,4,u,6>
   3713073254U, // <6,2,5,0>: Cost 4 vsldoi4 <3,6,2,5>, LHS
   3789082310U, // <6,2,5,1>: Cost 4 vsldoi8 <5,1,6,2>, <5,1,6,2>
   3840665439U, // <6,2,5,2>: Cost 4 vsldoi12 <2,5,2,6>, <2,5,2,6>
-  3840739176U, // <6,2,5,3>: Cost 3 vsldoi12 <2,5,3,6>, <2,5,3,6>
+  2766997352U, // <6,2,5,3>: Cost 3 vsldoi12 <2,5,3,6>, <2,5,3,6>
   3713076534U, // <6,2,5,4>: Cost 4 vsldoi4 <3,6,2,5>, RHS
   3791736842U, // <6,2,5,5>: Cost 4 vsldoi8 <5,5,6,2>, <5,5,6,2>
   3373180605U, // <6,2,5,6>: Cost 4 vmrglw <2,u,6,5>, <2,3,2,6>
   3793064108U, // <6,2,5,7>: Cost 4 vsldoi8 <5,7,6,2>, <5,7,6,2>
-  3841107861U, // <6,2,5,u>: Cost 3 vsldoi12 <2,5,u,6>, <2,5,u,6>
+  2767366037U, // <6,2,5,u>: Cost 3 vsldoi12 <2,5,u,6>, <2,5,u,6>
   3701137510U, // <6,2,6,0>: Cost 4 vsldoi4 <1,6,2,6>, LHS
   3701138647U, // <6,2,6,1>: Cost 4 vsldoi4 <1,6,2,6>, <1,6,2,6>
-  3328640616U, // <6,2,6,2>: Cost 3 vmrghw <6,6,6,6>, <2,2,2,2>
-  2322006118U, // <6,2,6,3>: Cost 2 vmrglw <6,6,6,6>, LHS
+  2254898792U, // <6,2,6,2>: Cost 3 vmrghw <6,6,6,6>, <2,2,2,2>
+  1248264294U, // <6,2,6,3>: Cost 2 vmrglw <6,6,6,6>, LHS
   3701140790U, // <6,2,6,4>: Cost 4 vsldoi4 <1,6,2,6>, RHS
   3725029435U, // <6,2,6,5>: Cost 4 vsldoi4 <5,6,2,6>, <5,6,2,6>
-  3328640954U, // <6,2,6,6>: Cost 3 vmrghw <6,6,6,6>, <2,6,3,7>
-  3799036805U, // <6,2,6,7>: Cost 3 vsldoi8 <6,7,6,2>, <6,7,6,2>
-  2322006123U, // <6,2,6,u>: Cost 2 vmrglw <6,6,6,6>, LHS
-  3707117670U, // <6,2,7,0>: Cost 3 vsldoi4 <2,6,2,7>, LHS
-  3383149292U, // <6,2,7,1>: Cost 3 vmrglw RHS, <1,0,2,1>
-  2309408360U, // <6,2,7,2>: Cost 2 vmrglw RHS, <2,2,2,2>
-  1235664998U, // <6,2,7,3>: Cost 1 vmrglw RHS, LHS
-  3707120950U, // <6,2,7,4>: Cost 3 vsldoi4 <2,6,2,7>, RHS
-  3383149620U, // <6,2,7,5>: Cost 3 vmrglw RHS, <1,4,2,5>
-  3383150269U, // <6,2,7,6>: Cost 3 vmrglw RHS, <2,3,2,6>
-  3383149784U, // <6,2,7,7>: Cost 3 vmrglw RHS, <1,6,2,7>
-  1235665003U, // <6,2,7,u>: Cost 1 vmrglw RHS, LHS
-  3707125862U, // <6,2,u,0>: Cost 3 vsldoi4 <2,6,2,u>, LHS
-  3383157484U, // <6,2,u,1>: Cost 3 vmrglw RHS, <1,0,2,1>
-  2309416552U, // <6,2,u,2>: Cost 2 vmrglw RHS, <2,2,2,2>
-  1235673190U, // <6,2,u,3>: Cost 1 vmrglw RHS, LHS
-  3707129142U, // <6,2,u,4>: Cost 3 vsldoi4 <2,6,2,u>, RHS
-  3842877549U, // <6,2,u,5>: Cost 3 vsldoi12 <2,u,5,6>, <2,u,5,6>
-  3383158461U, // <6,2,u,6>: Cost 3 vmrglw RHS, <2,3,2,6>
-  3383157976U, // <6,2,u,7>: Cost 3 vmrglw RHS, <1,6,2,7>
-  1235673195U, // <6,2,u,u>: Cost 1 vmrglw RHS, LHS
+  2254899130U, // <6,2,6,6>: Cost 3 vmrghw <6,6,6,6>, <2,6,3,7>
+  2725294981U, // <6,2,6,7>: Cost 3 vsldoi8 <6,7,6,2>, <6,7,6,2>
+  1248264299U, // <6,2,6,u>: Cost 2 vmrglw <6,6,6,6>, LHS
+  2633375846U, // <6,2,7,0>: Cost 3 vsldoi4 <2,6,2,7>, LHS
+  2309407468U, // <6,2,7,1>: Cost 3 vmrglw RHS, <1,0,2,1>
+  1235666536U, // <6,2,7,2>: Cost 2 vmrglw RHS, <2,2,2,2>
+  161923174U,  // <6,2,7,3>: Cost 1 vmrglw RHS, LHS
+  2633379126U, // <6,2,7,4>: Cost 3 vsldoi4 <2,6,2,7>, RHS
+  2309407796U, // <6,2,7,5>: Cost 3 vmrglw RHS, <1,4,2,5>
+  2309408445U, // <6,2,7,6>: Cost 3 vmrglw RHS, <2,3,2,6>
+  2309407960U, // <6,2,7,7>: Cost 3 vmrglw RHS, <1,6,2,7>
+  161923179U,  // <6,2,7,u>: Cost 1 vmrglw RHS, LHS
+  2633384038U, // <6,2,u,0>: Cost 3 vsldoi4 <2,6,2,u>, LHS
+  2309415660U, // <6,2,u,1>: Cost 3 vmrglw RHS, <1,0,2,1>
+  1235674728U, // <6,2,u,2>: Cost 2 vmrglw RHS, <2,2,2,2>
+  161931366U,  // <6,2,u,3>: Cost 1 vmrglw RHS, LHS
+  2633387318U, // <6,2,u,4>: Cost 3 vsldoi4 <2,6,2,u>, RHS
+  2769135725U, // <6,2,u,5>: Cost 3 vsldoi12 <2,u,5,6>, <2,u,5,6>
+  2309416637U, // <6,2,u,6>: Cost 3 vmrglw RHS, <2,3,2,6>
+  2309416152U, // <6,2,u,7>: Cost 3 vmrglw RHS, <1,6,2,7>
+  161931371U,  // <6,2,u,u>: Cost 1 vmrglw RHS, LHS
   3777806336U, // <6,3,0,0>: Cost 4 vsldoi8 <3,2,6,3>, <0,0,0,0>
-  3777806438U, // <6,3,0,1>: Cost 3 vsldoi8 <3,2,6,3>, LHS
+  2704064614U, // <6,3,0,1>: Cost 3 vsldoi8 <3,2,6,3>, LHS
   3765862577U, // <6,3,0,2>: Cost 4 vsldoi8 <1,2,6,3>, <0,2,1,6>
   3843393708U, // <6,3,0,3>: Cost 4 vsldoi12 <3,0,3,6>, <3,0,3,6>
-  3324258818U, // <6,3,0,4>: Cost 3 vmrghw <6,0,1,2>, <3,4,5,6>
+  2250516994U, // <6,3,0,4>: Cost 3 vmrghw <6,0,1,2>, <3,4,5,6>
   3725054014U, // <6,3,0,5>: Cost 4 vsldoi4 <5,6,3,0>, <5,6,3,0>
   3383093096U, // <6,3,0,6>: Cost 4 vmrglw <4,5,6,0>, <2,5,3,6>
   3368495034U, // <6,3,0,7>: Cost 4 vmrglw <2,1,6,0>, <2,6,3,7>
-  3777807005U, // <6,3,0,u>: Cost 3 vsldoi8 <3,2,6,3>, LHS
-  3325364374U, // <6,3,1,0>: Cost 3 vmrghw <6,1,7,2>, <3,0,1,2>
+  2704065181U, // <6,3,0,u>: Cost 3 vsldoi8 <3,2,6,3>, LHS
+  2251622550U, // <6,3,1,0>: Cost 3 vmrghw <6,1,7,2>, <3,0,1,2>
   3777807156U, // <6,3,1,1>: Cost 4 vsldoi8 <3,2,6,3>, <1,1,1,1>
   3765863348U, // <6,3,1,2>: Cost 4 vsldoi8 <1,2,6,3>, <1,2,6,3>
   3373147762U, // <6,3,1,3>: Cost 4 vmrglw <2,u,6,1>, <2,2,3,3>
   3834251525U, // <6,3,1,4>: Cost 4 vsldoi12 <1,4,5,6>, <3,1,4,5>
   3373147683U, // <6,3,1,5>: Cost 5 vmrglw <2,u,6,1>, <2,1,3,5>
   3391727545U, // <6,3,1,6>: Cost 4 vmrglw <6,0,6,1>, <2,6,3,6>
-  3373148090U, // <6,3,1,7>: Cost 3 vmrglw <2,u,6,1>, <2,6,3,7>
-  3325364374U, // <6,3,1,u>: Cost 3 vmrghw <6,1,7,2>, <3,0,1,2>
-  3326036118U, // <6,3,2,0>: Cost 3 vmrghw <6,2,7,3>, <3,0,1,2>
+  2299406266U, // <6,3,1,7>: Cost 3 vmrglw <2,u,6,1>, <2,6,3,7>
+  2251622550U, // <6,3,1,u>: Cost 3 vmrghw <6,1,7,2>, <3,0,1,2>
+  2252294294U, // <6,3,2,0>: Cost 3 vmrghw <6,2,7,3>, <3,0,1,2>
   3326036198U, // <6,3,2,1>: Cost 4 vmrghw <6,2,7,3>, <3,1,1,1>
   3771836045U, // <6,3,2,2>: Cost 4 vsldoi8 <2,2,6,3>, <2,2,6,3>
-  3326036380U, // <6,3,2,3>: Cost 3 vmrghw <6,2,7,3>, <3,3,3,3>
-  3326036482U, // <6,3,2,4>: Cost 3 vmrghw <6,2,7,3>, <3,4,5,6>
+  2252294556U, // <6,3,2,3>: Cost 3 vmrghw <6,2,7,3>, <3,3,3,3>
+  2252294658U, // <6,3,2,4>: Cost 3 vmrghw <6,2,7,3>, <3,4,5,6>
   3840739677U, // <6,3,2,5>: Cost 4 vsldoi12 <2,5,3,6>, <3,2,5,3>
-  3777808314U, // <6,3,2,6>: Cost 3 vsldoi8 <3,2,6,3>, <2,6,3,7>
+  2704066490U, // <6,3,2,6>: Cost 3 vsldoi8 <3,2,6,3>, <2,6,3,7>
   3368511418U, // <6,3,2,7>: Cost 4 vmrglw <2,1,6,2>, <2,6,3,7>
-  3326036766U, // <6,3,2,u>: Cost 3 vmrghw <6,2,7,3>, <3,u,1,2>
+  2252294942U, // <6,3,2,u>: Cost 3 vmrghw <6,2,7,3>, <3,u,1,2>
   3707158630U, // <6,3,3,0>: Cost 4 vsldoi4 <2,6,3,3>, LHS
   3765864692U, // <6,3,3,1>: Cost 5 vsldoi8 <1,2,6,3>, <3,1,2,6>
-  3777808742U, // <6,3,3,2>: Cost 3 vsldoi8 <3,2,6,3>, <3,2,6,3>
-  3846195612U, // <6,3,3,3>: Cost 3 vsldoi12 <3,4,5,6>, <3,3,3,3>
-  3846195623U, // <6,3,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <3,3,4,5>
+  2704066918U, // <6,3,3,2>: Cost 3 vsldoi8 <3,2,6,3>, <3,2,6,3>
+  2772453788U, // <6,3,3,3>: Cost 3 vsldoi12 <3,4,5,6>, <3,3,3,3>
+  2772453799U, // <6,3,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <3,3,4,5>
   3789752888U, // <6,3,3,5>: Cost 4 vsldoi8 <5,2,6,3>, <3,5,2,6>
   3840739770U, // <6,3,3,6>: Cost 4 vsldoi12 <2,5,3,6>, <3,3,6,6>
-  3375155130U, // <6,3,3,7>: Cost 3 vmrglw <3,2,6,3>, <2,6,3,7>
-  3848849867U, // <6,3,3,u>: Cost 3 vsldoi12 <3,u,5,6>, <3,3,u,5>
-  3725082726U, // <6,3,4,0>: Cost 3 vsldoi4 <5,6,3,4>, LHS
+  2301413306U, // <6,3,3,7>: Cost 3 vmrglw <3,2,6,3>, <2,6,3,7>
+  2775108043U, // <6,3,3,u>: Cost 3 vsldoi12 <3,u,5,6>, <3,3,u,5>
+  2651340902U, // <6,3,4,0>: Cost 3 vsldoi4 <5,6,3,4>, LHS
   3846195674U, // <6,3,4,1>: Cost 4 vsldoi12 <3,4,5,6>, <3,4,1,2>
   3845974503U, // <6,3,4,2>: Cost 4 vsldoi12 <3,4,2,6>, <3,4,2,6>
-  3725085186U, // <6,3,4,3>: Cost 3 vsldoi4 <5,6,3,4>, <3,4,5,6>
-  3725086006U, // <6,3,4,4>: Cost 3 vsldoi4 <5,6,3,4>, RHS
-  2772453890U, // <6,3,4,5>: Cost 2 vsldoi12 <3,4,5,6>, <3,4,5,6>
+  2651343362U, // <6,3,4,3>: Cost 3 vsldoi4 <5,6,3,4>, <3,4,5,6>
+  2651344182U, // <6,3,4,4>: Cost 3 vsldoi4 <5,6,3,4>, RHS
+  1698712066U, // <6,3,4,5>: Cost 2 vsldoi12 <3,4,5,6>, <3,4,5,6>
   3383125864U, // <6,3,4,6>: Cost 4 vmrglw <4,5,6,4>, <2,5,3,6>
   3368527802U, // <6,3,4,7>: Cost 4 vmrglw <2,1,6,4>, <2,6,3,7>
-  2772675101U, // <6,3,4,u>: Cost 2 vsldoi12 <3,4,u,6>, <3,4,u,6>
+  1698933277U, // <6,3,4,u>: Cost 2 vsldoi12 <3,4,u,6>, <3,4,u,6>
   3373179798U, // <6,3,5,0>: Cost 4 vmrglw <2,u,6,5>, <1,2,3,0>
   3707176179U, // <6,3,5,1>: Cost 5 vsldoi4 <2,6,3,5>, <1,6,5,7>
-  3789754136U, // <6,3,5,2>: Cost 3 vsldoi8 <5,2,6,3>, <5,2,6,3>
+  2716012312U, // <6,3,5,2>: Cost 3 vsldoi8 <5,2,6,3>, <5,2,6,3>
   3373180530U, // <6,3,5,3>: Cost 4 vmrglw <2,u,6,5>, <2,2,3,3>
-  3328051714U, // <6,3,5,4>: Cost 3 vmrghw <6,5,7,6>, <3,4,5,6>
+  2254309890U, // <6,3,5,4>: Cost 3 vmrghw <6,5,7,6>, <3,4,5,6>
   3785773070U, // <6,3,5,5>: Cost 4 vsldoi8 <4,5,6,3>, <5,5,6,6>
   3840739932U, // <6,3,5,6>: Cost 4 vsldoi12 <2,5,3,6>, <3,5,6,6>
-  3373180858U, // <6,3,5,7>: Cost 3 vmrglw <2,u,6,5>, <2,6,3,7>
-  3793735934U, // <6,3,5,u>: Cost 3 vsldoi8 <5,u,6,3>, <5,u,6,3>
-  3328641174U, // <6,3,6,0>: Cost 3 vmrghw <6,6,6,6>, <3,0,1,2>
+  2299439034U, // <6,3,5,7>: Cost 3 vmrglw <2,u,6,5>, <2,6,3,7>
+  2719994110U, // <6,3,5,u>: Cost 3 vsldoi8 <5,u,6,3>, <5,u,6,3>
+  2254899350U, // <6,3,6,0>: Cost 3 vmrghw <6,6,6,6>, <3,0,1,2>
   3328641254U, // <6,3,6,1>: Cost 4 vmrghw <6,6,6,6>, <3,1,1,1>
-  3707185081U, // <6,3,6,2>: Cost 3 vsldoi4 <2,6,3,6>, <2,6,3,6>
-  3328641436U, // <6,3,6,3>: Cost 3 vmrghw <6,6,6,6>, <3,3,3,3>
-  3328641538U, // <6,3,6,4>: Cost 3 vmrghw <6,6,6,6>, <3,4,5,6>
+  2633443257U, // <6,3,6,2>: Cost 3 vsldoi4 <2,6,3,6>, <2,6,3,6>
+  2254899612U, // <6,3,6,3>: Cost 3 vmrghw <6,6,6,6>, <3,3,3,3>
+  2254899714U, // <6,3,6,4>: Cost 3 vmrghw <6,6,6,6>, <3,4,5,6>
   3785773772U, // <6,3,6,5>: Cost 4 vsldoi8 <4,5,6,3>, <6,5,3,6>
-  3799708472U, // <6,3,6,6>: Cost 3 vsldoi8 <6,u,6,3>, <6,6,6,6>
-  3395749818U, // <6,3,6,7>: Cost 3 vmrglw <6,6,6,6>, <2,6,3,7>
-  3328641822U, // <6,3,6,u>: Cost 3 vmrghw <6,6,6,6>, <3,u,1,2>
-  2633449574U, // <6,3,7,0>: Cost 2 vsldoi4 <2,6,3,7>, LHS
-  3707192116U, // <6,3,7,1>: Cost 3 vsldoi4 <2,6,3,7>, <1,1,1,1>
-  2633451450U, // <6,3,7,2>: Cost 2 vsldoi4 <2,6,3,7>, <2,6,3,7>
-  2309408370U, // <6,3,7,3>: Cost 2 vmrglw RHS, <2,2,3,3>
-  2633452854U, // <6,3,7,4>: Cost 2 vsldoi4 <2,6,3,7>, RHS
-  3383150115U, // <6,3,7,5>: Cost 3 vmrglw RHS, <2,1,3,5>
-  3707195976U, // <6,3,7,6>: Cost 3 vsldoi4 <2,6,3,7>, <6,3,7,0>
-  2309408698U, // <6,3,7,7>: Cost 2 vmrglw RHS, <2,6,3,7>
-  2633455406U, // <6,3,7,u>: Cost 2 vsldoi4 <2,6,3,7>, LHS
-  2633457766U, // <6,3,u,0>: Cost 2 vsldoi4 <2,6,3,u>, LHS
-  3707200308U, // <6,3,u,1>: Cost 3 vsldoi4 <2,6,3,u>, <1,1,1,1>
-  2633459643U, // <6,3,u,2>: Cost 2 vsldoi4 <2,6,3,u>, <2,6,3,u>
-  2309416562U, // <6,3,u,3>: Cost 2 vmrglw RHS, <2,2,3,3>
-  2633461046U, // <6,3,u,4>: Cost 2 vsldoi4 <2,6,3,u>, RHS
-  2775108422U, // <6,3,u,5>: Cost 2 vsldoi12 <3,u,5,6>, <3,u,5,6>
-  3707204177U, // <6,3,u,6>: Cost 3 vsldoi4 <2,6,3,u>, <6,3,u,0>
-  2309416890U, // <6,3,u,7>: Cost 2 vmrglw RHS, <2,6,3,7>
-  2633463598U, // <6,3,u,u>: Cost 2 vsldoi4 <2,6,3,u>, LHS
+  2725966648U, // <6,3,6,6>: Cost 3 vsldoi8 <6,u,6,3>, <6,6,6,6>
+  2322007994U, // <6,3,6,7>: Cost 3 vmrglw <6,6,6,6>, <2,6,3,7>
+  2254899998U, // <6,3,6,u>: Cost 3 vmrghw <6,6,6,6>, <3,u,1,2>
+  1559707750U, // <6,3,7,0>: Cost 2 vsldoi4 <2,6,3,7>, LHS
+  2633450292U, // <6,3,7,1>: Cost 3 vsldoi4 <2,6,3,7>, <1,1,1,1>
+  1559709626U, // <6,3,7,2>: Cost 2 vsldoi4 <2,6,3,7>, <2,6,3,7>
+  1235666546U, // <6,3,7,3>: Cost 2 vmrglw RHS, <2,2,3,3>
+  1559711030U, // <6,3,7,4>: Cost 2 vsldoi4 <2,6,3,7>, RHS
+  2309408291U, // <6,3,7,5>: Cost 3 vmrglw RHS, <2,1,3,5>
+  2633454152U, // <6,3,7,6>: Cost 3 vsldoi4 <2,6,3,7>, <6,3,7,0>
+  1235666874U, // <6,3,7,7>: Cost 2 vmrglw RHS, <2,6,3,7>
+  1559713582U, // <6,3,7,u>: Cost 2 vsldoi4 <2,6,3,7>, LHS
+  1559715942U, // <6,3,u,0>: Cost 2 vsldoi4 <2,6,3,u>, LHS
+  2633458484U, // <6,3,u,1>: Cost 3 vsldoi4 <2,6,3,u>, <1,1,1,1>
+  1559717819U, // <6,3,u,2>: Cost 2 vsldoi4 <2,6,3,u>, <2,6,3,u>
+  1235674738U, // <6,3,u,3>: Cost 2 vmrglw RHS, <2,2,3,3>
+  1559719222U, // <6,3,u,4>: Cost 2 vsldoi4 <2,6,3,u>, RHS
+  1701366598U, // <6,3,u,5>: Cost 2 vsldoi12 <3,u,5,6>, <3,u,5,6>
+  2633462353U, // <6,3,u,6>: Cost 3 vsldoi4 <2,6,3,u>, <6,3,u,0>
+  1235675066U, // <6,3,u,7>: Cost 2 vmrglw RHS, <2,6,3,7>
+  1559721774U, // <6,3,u,u>: Cost 2 vsldoi4 <2,6,3,u>, LHS
   3785777152U, // <6,4,0,0>: Cost 4 vsldoi8 <4,5,6,4>, <0,0,0,0>
-  3785777254U, // <6,4,0,1>: Cost 3 vsldoi8 <4,5,6,4>, LHS
+  2712035430U, // <6,4,0,1>: Cost 3 vsldoi8 <4,5,6,4>, LHS
   3771179185U, // <6,4,0,2>: Cost 4 vsldoi8 <2,1,6,4>, <0,2,1,6>
   3846196096U, // <6,4,0,3>: Cost 4 vsldoi12 <3,4,5,6>, <4,0,3,1>
   3785777490U, // <6,4,0,4>: Cost 4 vsldoi8 <4,5,6,4>, <0,4,1,5>
-  3324259638U, // <6,4,0,5>: Cost 3 vmrghw <6,0,1,2>, RHS
+  2250517814U, // <6,4,0,5>: Cost 3 vmrghw <6,0,1,2>, RHS
   3324259703U, // <6,4,0,6>: Cost 4 vmrghw <6,0,1,2>, <4,6,5,0>
   3383092458U, // <6,4,0,7>: Cost 5 vmrglw <4,5,6,0>, <1,6,4,7>
-  3785777821U, // <6,4,0,u>: Cost 3 vsldoi8 <4,5,6,4>, LHS
+  2712035997U, // <6,4,0,u>: Cost 3 vsldoi8 <4,5,6,4>, LHS
   3325356946U, // <6,4,1,0>: Cost 4 vmrghw <6,1,7,1>, <4,0,5,1>
   3785777972U, // <6,4,1,1>: Cost 4 vsldoi8 <4,5,6,4>, <1,1,1,1>
   3846196170U, // <6,4,1,2>: Cost 4 vsldoi12 <3,4,5,6>, <4,1,2,3>
   3325365380U, // <6,4,1,3>: Cost 4 vmrghw <6,1,7,2>, <4,3,5,0>
   3852168155U, // <6,4,1,4>: Cost 4 vsldoi12 <4,4,5,6>, <4,1,4,2>
-  3325357366U, // <6,4,1,5>: Cost 3 vmrghw <6,1,7,1>, RHS
+  2251615542U, // <6,4,1,5>: Cost 3 vmrghw <6,1,7,1>, RHS
   3325357432U, // <6,4,1,6>: Cost 4 vmrghw <6,1,7,1>, <4,6,5,1>
   3870084088U, // <6,4,1,7>: Cost 4 vsldoi12 <7,4,5,6>, <4,1,7,4>
-  3325357609U, // <6,4,1,u>: Cost 3 vmrghw <6,1,7,1>, RHS
-  3326036882U, // <6,4,2,0>: Cost 3 vmrghw <6,2,7,3>, <4,0,5,1>
+  2251615785U, // <6,4,1,u>: Cost 3 vmrghw <6,1,7,1>, RHS
+  2252295058U, // <6,4,2,0>: Cost 3 vmrghw <6,2,7,3>, <4,0,5,1>
   3771180605U, // <6,4,2,1>: Cost 4 vsldoi8 <2,1,6,4>, <2,1,6,4>
   3785778792U, // <6,4,2,2>: Cost 4 vsldoi8 <4,5,6,4>, <2,2,2,2>
   3777816253U, // <6,4,2,3>: Cost 4 vsldoi8 <3,2,6,4>, <2,3,2,6>
-  3326037200U, // <6,4,2,4>: Cost 3 vmrghw <6,2,7,3>, <4,4,4,4>
-  2252295478U, // <6,4,2,5>: Cost 2 vmrghw <6,2,7,3>, RHS
-  3326037369U, // <6,4,2,6>: Cost 3 vmrghw <6,2,7,3>, <4,6,5,2>
+  2252295376U, // <6,4,2,4>: Cost 3 vmrghw <6,2,7,3>, <4,4,4,4>
+  1178553654U, // <6,4,2,5>: Cost 2 vmrghw <6,2,7,3>, RHS
+  2252295545U, // <6,4,2,6>: Cost 3 vmrghw <6,2,7,3>, <4,6,5,2>
   3326037448U, // <6,4,2,7>: Cost 4 vmrghw <6,2,7,3>, <4,7,5,0>
-  2252295721U, // <6,4,2,u>: Cost 2 vmrghw <6,2,7,3>, RHS
+  1178553897U, // <6,4,2,u>: Cost 2 vmrghw <6,2,7,3>, RHS
   3785779350U, // <6,4,3,0>: Cost 4 vsldoi8 <4,5,6,4>, <3,0,1,2>
   3383118648U, // <6,4,3,1>: Cost 4 vmrglw <4,5,6,3>, <3,u,4,1>
   3777816935U, // <6,4,3,2>: Cost 4 vsldoi8 <3,2,6,4>, <3,2,6,4>
   3785779612U, // <6,4,3,3>: Cost 4 vsldoi8 <4,5,6,4>, <3,3,3,3>
-  3785779714U, // <6,4,3,4>: Cost 3 vsldoi8 <4,5,6,4>, <3,4,5,6>
-  3326496054U, // <6,4,3,5>: Cost 3 vmrghw <6,3,4,5>, RHS
+  2712037890U, // <6,4,3,4>: Cost 3 vsldoi8 <4,5,6,4>, <3,4,5,6>
+  2252754230U, // <6,4,3,5>: Cost 3 vmrghw <6,3,4,5>, RHS
   3784452764U, // <6,4,3,6>: Cost 4 vsldoi8 <4,3,6,4>, <3,6,4,7>
   3801705178U, // <6,4,3,7>: Cost 4 vsldoi8 <7,2,6,4>, <3,7,2,6>
-  3326496297U, // <6,4,3,u>: Cost 3 vmrghw <6,3,4,5>, RHS
+  2252754473U, // <6,4,3,u>: Cost 3 vmrghw <6,3,4,5>, RHS
   3787770770U, // <6,4,4,0>: Cost 4 vsldoi8 <4,u,6,4>, <4,0,5,1>
   3383126840U, // <6,4,4,1>: Cost 4 vmrglw <4,5,6,4>, <3,u,4,1>
   3327380534U, // <6,4,4,2>: Cost 4 vmrghw <6,4,7,5>, <4,2,5,3>
   3784453265U, // <6,4,4,3>: Cost 4 vsldoi8 <4,3,6,4>, <4,3,6,4>
-  3327372496U, // <6,4,4,4>: Cost 3 vmrghw <6,4,7,4>, <4,4,4,4>
-  3852168411U, // <6,4,4,5>: Cost 3 vsldoi12 <4,4,5,6>, <4,4,5,6>
+  2253630672U, // <6,4,4,4>: Cost 3 vmrghw <6,4,7,4>, <4,4,4,4>
+  2778426587U, // <6,4,4,5>: Cost 3 vsldoi12 <4,4,5,6>, <4,4,5,6>
   3383128789U, // <6,4,4,6>: Cost 4 vmrglw <4,5,6,4>, <6,5,4,6>
   3381799580U, // <6,4,4,7>: Cost 4 vmrglw <4,3,6,4>, <3,6,4,7>
-  3852389622U, // <6,4,4,u>: Cost 3 vsldoi12 <4,4,u,6>, <4,4,u,6>
-  3725164646U, // <6,4,5,0>: Cost 3 vsldoi4 <5,6,4,5>, LHS
+  2778647798U, // <6,4,4,u>: Cost 3 vsldoi12 <4,4,u,6>, <4,4,u,6>
+  2651422822U, // <6,4,5,0>: Cost 3 vsldoi4 <5,6,4,5>, LHS
   3701277928U, // <6,4,5,1>: Cost 4 vsldoi4 <1,6,4,5>, <1,6,4,5>
   3701278650U, // <6,4,5,2>: Cost 4 vsldoi4 <1,6,4,5>, <2,6,3,7>
-  3725167106U, // <6,4,5,3>: Cost 3 vsldoi4 <5,6,4,5>, <3,4,5,6>
-  3725167926U, // <6,4,5,4>: Cost 3 vsldoi4 <5,6,4,5>, RHS
-  3725168716U, // <6,4,5,5>: Cost 3 vsldoi4 <5,6,4,5>, <5,6,4,5>
-  2772454710U, // <6,4,5,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  2651425282U, // <6,4,5,3>: Cost 3 vsldoi4 <5,6,4,5>, <3,4,5,6>
+  2651426102U, // <6,4,5,4>: Cost 3 vsldoi4 <5,6,4,5>, RHS
+  2651426892U, // <6,4,5,5>: Cost 3 vsldoi4 <5,6,4,5>, <5,6,4,5>
+  1698712886U, // <6,4,5,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
   3725169658U, // <6,4,5,7>: Cost 4 vsldoi4 <5,6,4,5>, <7,0,1,2>
-  2772454728U, // <6,4,5,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
-  3328641938U, // <6,4,6,0>: Cost 3 vmrghw <6,6,6,6>, <4,0,5,1>
+  1698712904U, // <6,4,5,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  2254900114U, // <6,4,6,0>: Cost 3 vmrghw <6,6,6,6>, <4,0,5,1>
   3389115192U, // <6,4,6,1>: Cost 4 vmrglw <5,5,6,6>, <3,u,4,1>
   3785781727U, // <6,4,6,2>: Cost 4 vsldoi8 <4,5,6,4>, <6,2,4,3>
   3785781810U, // <6,4,6,3>: Cost 4 vsldoi8 <4,5,6,4>, <6,3,4,5>
-  3328642256U, // <6,4,6,4>: Cost 3 vmrghw <6,6,6,6>, <4,4,4,4>
-  2254900534U, // <6,4,6,5>: Cost 2 vmrghw <6,6,6,6>, RHS
-  3328642429U, // <6,4,6,6>: Cost 3 vmrghw <6,6,6,6>, <4,6,5,6>
+  2254900432U, // <6,4,6,4>: Cost 3 vmrghw <6,6,6,6>, <4,4,4,4>
+  1181158710U, // <6,4,6,5>: Cost 2 vmrghw <6,6,6,6>, RHS
+  2254900605U, // <6,4,6,6>: Cost 3 vmrghw <6,6,6,6>, <4,6,5,6>
   3787772750U, // <6,4,6,7>: Cost 4 vsldoi8 <4,u,6,4>, <6,7,0,1>
-  2254900777U, // <6,4,6,u>: Cost 2 vmrghw <6,6,6,6>, RHS
-  3713237094U, // <6,4,7,0>: Cost 3 vsldoi4 <3,6,4,7>, LHS
-  3713237914U, // <6,4,7,1>: Cost 3 vsldoi4 <3,6,4,7>, <1,2,3,4>
+  1181158953U, // <6,4,6,u>: Cost 2 vmrghw <6,6,6,6>, RHS
+  2639495270U, // <6,4,7,0>: Cost 3 vsldoi4 <3,6,4,7>, LHS
+  2639496090U, // <6,4,7,1>: Cost 3 vsldoi4 <3,6,4,7>, <1,2,3,4>
   3707267011U, // <6,4,7,2>: Cost 4 vsldoi4 <2,6,4,7>, <2,6,4,7>
-  3713239708U, // <6,4,7,3>: Cost 3 vsldoi4 <3,6,4,7>, <3,6,4,7>
-  2311400656U, // <6,4,7,4>: Cost 2 vmrglw RHS, <4,4,4,4>
-  2309408462U, // <6,4,7,5>: Cost 2 vmrglw RHS, <2,3,4,5>
+  2639497884U, // <6,4,7,3>: Cost 3 vsldoi4 <3,6,4,7>, <3,6,4,7>
+  1237658832U, // <6,4,7,4>: Cost 2 vmrglw RHS, <4,4,4,4>
+  1235666638U, // <6,4,7,5>: Cost 2 vmrglw RHS, <2,3,4,5>
   3713241753U, // <6,4,7,6>: Cost 4 vsldoi4 <3,6,4,7>, <6,4,7,0>
-  3383151260U, // <6,4,7,7>: Cost 3 vmrglw RHS, <3,6,4,7>
-  2309408465U, // <6,4,7,u>: Cost 2 vmrglw RHS, <2,3,4,u>
-  3713245286U, // <6,4,u,0>: Cost 3 vsldoi4 <3,6,4,u>, LHS
-  3713246106U, // <6,4,u,1>: Cost 3 vsldoi4 <3,6,4,u>, <1,2,3,4>
+  2309409436U, // <6,4,7,7>: Cost 3 vmrglw RHS, <3,6,4,7>
+  1235666641U, // <6,4,7,u>: Cost 2 vmrglw RHS, <2,3,4,u>
+  2639503462U, // <6,4,u,0>: Cost 3 vsldoi4 <3,6,4,u>, LHS
+  2639504282U, // <6,4,u,1>: Cost 3 vsldoi4 <3,6,4,u>, <1,2,3,4>
   3701303226U, // <6,4,u,2>: Cost 4 vsldoi4 <1,6,4,u>, <2,6,3,7>
-  3713247901U, // <6,4,u,3>: Cost 3 vsldoi4 <3,6,4,u>, <3,6,4,u>
-  2309418192U, // <6,4,u,4>: Cost 2 vmrglw RHS, <4,4,4,4>
-  2309416654U, // <6,4,u,5>: Cost 2 vmrglw RHS, <2,3,4,5>
-  2772454953U, // <6,4,u,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
-  3383159452U, // <6,4,u,7>: Cost 3 vmrglw RHS, <3,6,4,7>
-  2772454971U, // <6,4,u,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  2639506077U, // <6,4,u,3>: Cost 3 vsldoi4 <3,6,4,u>, <3,6,4,u>
+  1235676368U, // <6,4,u,4>: Cost 2 vmrglw RHS, <4,4,4,4>
+  1235674830U, // <6,4,u,5>: Cost 2 vmrglw RHS, <2,3,4,5>
+  1698713129U, // <6,4,u,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  2309417628U, // <6,4,u,7>: Cost 3 vmrglw RHS, <3,6,4,7>
+  1698713147U, // <6,4,u,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
   3775832064U, // <6,5,0,0>: Cost 4 vsldoi8 <2,u,6,5>, <0,0,0,0>
-  3775832166U, // <6,5,0,1>: Cost 3 vsldoi8 <2,u,6,5>, LHS
+  2702090342U, // <6,5,0,1>: Cost 3 vsldoi8 <2,u,6,5>, LHS
   3775832241U, // <6,5,0,2>: Cost 4 vsldoi8 <2,u,6,5>, <0,2,1,6>
   3719227906U, // <6,5,0,3>: Cost 4 vsldoi4 <4,6,5,0>, <3,4,5,6>
   3775832402U, // <6,5,0,4>: Cost 4 vsldoi8 <2,u,6,5>, <0,4,1,5>
   3385085146U, // <6,5,0,5>: Cost 4 vmrglw <4,u,6,0>, <4,4,5,5>
-  3383093762U, // <6,5,0,6>: Cost 3 vmrglw <4,5,6,0>, <3,4,5,6>
+  2309351938U, // <6,5,0,6>: Cost 3 vmrglw <4,5,6,0>, <3,4,5,6>
   3376459134U, // <6,5,0,7>: Cost 5 vmrglw <3,4,6,0>, <4,6,5,7>
-  3775832733U, // <6,5,0,u>: Cost 3 vsldoi8 <2,u,6,5>, LHS
+  2702090909U, // <6,5,0,u>: Cost 3 vsldoi8 <2,u,6,5>, LHS
   3719233546U, // <6,5,1,0>: Cost 4 vsldoi4 <4,6,5,1>, <0,0,1,1>
   3775832884U, // <6,5,1,1>: Cost 4 vsldoi8 <2,u,6,5>, <1,1,1,1>
   3775832982U, // <6,5,1,2>: Cost 4 vsldoi8 <2,u,6,5>, <1,2,3,0>
@@ -4818,807 +4818,807 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3834252997U, // <6,5,1,6>: Cost 4 vsldoi12 <1,4,5,6>, <5,1,6,1>
   3870084817U, // <6,5,1,7>: Cost 4 vsldoi12 <7,4,5,6>, <5,1,7,4>
   3769861532U, // <6,5,1,u>: Cost 4 vsldoi8 <1,u,6,5>, <1,u,6,5>
-  3719241830U, // <6,5,2,0>: Cost 3 vsldoi4 <4,6,5,2>, LHS
+  2645500006U, // <6,5,2,0>: Cost 3 vsldoi4 <4,6,5,2>, LHS
   3719242548U, // <6,5,2,1>: Cost 4 vsldoi4 <4,6,5,2>, <1,1,1,1>
   3775833704U, // <6,5,2,2>: Cost 4 vsldoi8 <2,u,6,5>, <2,2,2,2>
   3775833766U, // <6,5,2,3>: Cost 4 vsldoi8 <2,u,6,5>, <2,3,0,1>
-  3719245177U, // <6,5,2,4>: Cost 3 vsldoi4 <4,6,5,2>, <4,6,5,2>
-  3326038020U, // <6,5,2,5>: Cost 3 vmrghw <6,2,7,3>, <5,5,5,5>
-  3775834042U, // <6,5,2,6>: Cost 3 vsldoi8 <2,u,6,5>, <2,6,3,7>
+  2645503353U, // <6,5,2,4>: Cost 3 vsldoi4 <4,6,5,2>, <4,6,5,2>
+  2252296196U, // <6,5,2,5>: Cost 3 vmrghw <6,2,7,3>, <5,5,5,5>
+  2702092218U, // <6,5,2,6>: Cost 3 vsldoi8 <2,u,6,5>, <2,6,3,7>
   3719246842U, // <6,5,2,7>: Cost 4 vsldoi4 <4,6,5,2>, <7,0,1,2>
-  3775834229U, // <6,5,2,u>: Cost 3 vsldoi8 <2,u,6,5>, <2,u,6,5>
+  2702092405U, // <6,5,2,u>: Cost 3 vsldoi8 <2,u,6,5>, <2,u,6,5>
   3775834262U, // <6,5,3,0>: Cost 4 vsldoi8 <2,u,6,5>, <3,0,1,2>
   3777161495U, // <6,5,3,1>: Cost 4 vsldoi8 <3,1,6,5>, <3,1,6,5>
   3775834470U, // <6,5,3,2>: Cost 4 vsldoi8 <2,u,6,5>, <3,2,6,3>
   3775834524U, // <6,5,3,3>: Cost 4 vsldoi8 <2,u,6,5>, <3,3,3,3>
   3775834626U, // <6,5,3,4>: Cost 4 vsldoi8 <2,u,6,5>, <3,4,5,6>
   3385109722U, // <6,5,3,5>: Cost 4 vmrglw <4,u,6,3>, <4,4,5,5>
-  3383118338U, // <6,5,3,6>: Cost 3 vmrglw <4,5,6,3>, <3,4,5,6>
+  2309376514U, // <6,5,3,6>: Cost 3 vmrglw <4,5,6,3>, <3,4,5,6>
   3775834819U, // <6,5,3,7>: Cost 4 vsldoi8 <2,u,6,5>, <3,7,0,1>
-  3383118338U, // <6,5,3,u>: Cost 3 vmrglw <4,5,6,3>, <3,4,5,6>
+  2309376514U, // <6,5,3,u>: Cost 3 vmrglw <4,5,6,3>, <3,4,5,6>
   3719258214U, // <6,5,4,0>: Cost 4 vsldoi4 <4,6,5,4>, LHS
   3385117586U, // <6,5,4,1>: Cost 4 vmrglw <4,u,6,4>, <4,0,5,1>
   3327242008U, // <6,5,4,2>: Cost 4 vmrghw <6,4,5,6>, <5,2,6,3>
   3719260674U, // <6,5,4,3>: Cost 4 vsldoi4 <4,6,5,4>, <3,4,5,6>
   3719261563U, // <6,5,4,4>: Cost 4 vsldoi4 <4,6,5,4>, <4,6,5,4>
-  3775835446U, // <6,5,4,5>: Cost 3 vsldoi8 <2,u,6,5>, RHS
-  3383126530U, // <6,5,4,6>: Cost 3 vmrglw <4,5,6,4>, <3,4,5,6>
+  2702093622U, // <6,5,4,5>: Cost 3 vsldoi8 <2,u,6,5>, RHS
+  2309384706U, // <6,5,4,6>: Cost 3 vmrglw <4,5,6,4>, <3,4,5,6>
   3870085060U, // <6,5,4,7>: Cost 4 vsldoi12 <7,4,5,6>, <5,4,7,4>
-  3775835689U, // <6,5,4,u>: Cost 3 vsldoi8 <2,u,6,5>, RHS
+  2702093865U, // <6,5,4,u>: Cost 3 vsldoi8 <2,u,6,5>, RHS
   3719266406U, // <6,5,5,0>: Cost 4 vsldoi4 <4,6,5,5>, LHS
   3789106889U, // <6,5,5,1>: Cost 4 vsldoi8 <5,1,6,5>, <5,1,6,5>
   3785789208U, // <6,5,5,2>: Cost 4 vsldoi8 <4,5,6,5>, <5,2,6,3>
   3373183950U, // <6,5,5,3>: Cost 4 vmrglw <2,u,6,5>, <6,u,5,3>
-  3791097788U, // <6,5,5,4>: Cost 3 vsldoi8 <5,4,6,5>, <5,4,6,5>
-  3865513988U, // <6,5,5,5>: Cost 3 vsldoi12 <6,6,6,6>, <5,5,5,5>
-  3846197262U, // <6,5,5,6>: Cost 3 vsldoi12 <3,4,5,6>, <5,5,6,6>
+  2717355964U, // <6,5,5,4>: Cost 3 vsldoi8 <5,4,6,5>, <5,4,6,5>
+  2791772164U, // <6,5,5,5>: Cost 3 vsldoi12 <6,6,6,6>, <5,5,5,5>
+  2772455438U, // <6,5,5,6>: Cost 3 vsldoi12 <3,4,5,6>, <5,5,6,6>
   3373183549U, // <6,5,5,7>: Cost 4 vmrglw <2,u,6,5>, <6,3,5,7>
-  3793752320U, // <6,5,5,u>: Cost 3 vsldoi8 <5,u,6,5>, <5,u,6,5>
-  3846197284U, // <6,5,6,0>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,0,1>
-  3395750802U, // <6,5,6,1>: Cost 3 vmrglw <6,6,6,6>, <4,0,5,1>
+  2720010496U, // <6,5,5,u>: Cost 3 vsldoi8 <5,u,6,5>, <5,u,6,5>
+  2772455460U, // <6,5,6,0>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,0,1>
+  2322008978U, // <6,5,6,1>: Cost 3 vmrglw <6,6,6,6>, <4,0,5,1>
   3840225335U, // <6,5,6,2>: Cost 4 vsldoi12 <2,4,5,6>, <5,6,2,2>
-  3846197314U, // <6,5,6,3>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,3,4>
-  3846197324U, // <6,5,6,4>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,4,5>
-  3328643076U, // <6,5,6,5>: Cost 3 vmrghw <6,6,6,6>, <5,5,5,5>
-  3846197344U, // <6,5,6,6>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,6,7>
-  3859615848U, // <6,5,6,7>: Cost 3 vsldoi12 <5,6,7,6>, <5,6,7,6>
-  3846197356U, // <6,5,6,u>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,u,1>
-  3701366886U, // <6,5,7,0>: Cost 3 vsldoi4 <1,6,5,7>, LHS
-  2309409682U, // <6,5,7,1>: Cost 2 vmrglw RHS, <4,0,5,1>
-  3383151102U, // <6,5,7,2>: Cost 3 vmrglw RHS, <3,4,5,2>
-  3383149483U, // <6,5,7,3>: Cost 3 vmrglw RHS, <1,2,5,3>
-  3701370166U, // <6,5,7,4>: Cost 3 vsldoi4 <1,6,5,7>, RHS
-  2309410010U, // <6,5,7,5>: Cost 2 vmrglw RHS, <4,4,5,5>
-  2309409282U, // <6,5,7,6>: Cost 2 vmrglw RHS, <3,4,5,6>
-  3383149811U, // <6,5,7,7>: Cost 3 vmrglw RHS, <1,6,5,7>
-  2309409284U, // <6,5,7,u>: Cost 2 vmrglw RHS, <3,4,5,u>
-  3701375078U, // <6,5,u,0>: Cost 3 vsldoi4 <1,6,5,u>, LHS
-  2309417874U, // <6,5,u,1>: Cost 2 vmrglw RHS, <4,0,5,1>
-  3383159294U, // <6,5,u,2>: Cost 3 vmrglw RHS, <3,4,5,2>
-  3383157675U, // <6,5,u,3>: Cost 3 vmrglw RHS, <1,2,5,3>
-  3701378358U, // <6,5,u,4>: Cost 3 vsldoi4 <1,6,5,u>, RHS
-  2309418202U, // <6,5,u,5>: Cost 2 vmrglw RHS, <4,4,5,5>
-  2309417474U, // <6,5,u,6>: Cost 2 vmrglw RHS, <3,4,5,6>
-  3383158003U, // <6,5,u,7>: Cost 3 vmrglw RHS, <1,6,5,7>
-  2309417476U, // <6,5,u,u>: Cost 2 vmrglw RHS, <3,4,5,u>
-  3383094575U, // <6,6,0,0>: Cost 3 vmrglw <4,5,6,0>, <4,5,6,0>
-  2724659302U, // <6,6,0,1>: Cost 2 vsldoi8 <6,6,6,6>, LHS
-  3324326394U, // <6,6,0,2>: Cost 3 vmrghw <6,0,2,1>, <6,2,7,3>
+  2772455490U, // <6,5,6,3>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,3,4>
+  2772455500U, // <6,5,6,4>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,4,5>
+  2254901252U, // <6,5,6,5>: Cost 3 vmrghw <6,6,6,6>, <5,5,5,5>
+  2772455520U, // <6,5,6,6>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,6,7>
+  2785874024U, // <6,5,6,7>: Cost 3 vsldoi12 <5,6,7,6>, <5,6,7,6>
+  2772455532U, // <6,5,6,u>: Cost 3 vsldoi12 <3,4,5,6>, <5,6,u,1>
+  2627625062U, // <6,5,7,0>: Cost 3 vsldoi4 <1,6,5,7>, LHS
+  1235667858U, // <6,5,7,1>: Cost 2 vmrglw RHS, <4,0,5,1>
+  2309409278U, // <6,5,7,2>: Cost 3 vmrglw RHS, <3,4,5,2>
+  2309407659U, // <6,5,7,3>: Cost 3 vmrglw RHS, <1,2,5,3>
+  2627628342U, // <6,5,7,4>: Cost 3 vsldoi4 <1,6,5,7>, RHS
+  1235668186U, // <6,5,7,5>: Cost 2 vmrglw RHS, <4,4,5,5>
+  1235667458U, // <6,5,7,6>: Cost 2 vmrglw RHS, <3,4,5,6>
+  2309407987U, // <6,5,7,7>: Cost 3 vmrglw RHS, <1,6,5,7>
+  1235667460U, // <6,5,7,u>: Cost 2 vmrglw RHS, <3,4,5,u>
+  2627633254U, // <6,5,u,0>: Cost 3 vsldoi4 <1,6,5,u>, LHS
+  1235676050U, // <6,5,u,1>: Cost 2 vmrglw RHS, <4,0,5,1>
+  2309417470U, // <6,5,u,2>: Cost 3 vmrglw RHS, <3,4,5,2>
+  2309415851U, // <6,5,u,3>: Cost 3 vmrglw RHS, <1,2,5,3>
+  2627636534U, // <6,5,u,4>: Cost 3 vsldoi4 <1,6,5,u>, RHS
+  1235676378U, // <6,5,u,5>: Cost 2 vmrglw RHS, <4,4,5,5>
+  1235675650U, // <6,5,u,6>: Cost 2 vmrglw RHS, <3,4,5,6>
+  2309416179U, // <6,5,u,7>: Cost 3 vmrglw RHS, <1,6,5,7>
+  1235675652U, // <6,5,u,u>: Cost 2 vmrglw RHS, <3,4,5,u>
+  2309352751U, // <6,6,0,0>: Cost 3 vmrglw <4,5,6,0>, <4,5,6,0>
+  1650917478U, // <6,6,0,1>: Cost 2 vsldoi8 <6,6,6,6>, LHS
+  2250584570U, // <6,6,0,2>: Cost 3 vmrghw <6,0,2,1>, <6,2,7,3>
   3846197554U, // <6,6,0,3>: Cost 4 vsldoi12 <3,4,5,6>, <6,0,3,1>
-  3798401362U, // <6,6,0,4>: Cost 3 vsldoi8 <6,6,6,6>, <0,4,1,5>
+  2724659538U, // <6,6,0,4>: Cost 3 vsldoi8 <6,6,6,6>, <0,4,1,5>
   3725275225U, // <6,6,0,5>: Cost 4 vsldoi4 <5,6,6,0>, <5,6,6,0>
-  3865514317U, // <6,6,0,6>: Cost 3 vsldoi12 <6,6,6,6>, <6,0,6,1>
-  3383094582U, // <6,6,0,7>: Cost 3 vmrglw <4,5,6,0>, RHS
-  2724659869U, // <6,6,0,u>: Cost 2 vsldoi8 <6,6,6,6>, LHS
+  2791772493U, // <6,6,0,6>: Cost 3 vsldoi12 <6,6,6,6>, <6,0,6,1>
+  2309352758U, // <6,6,0,7>: Cost 3 vmrglw <4,5,6,0>, RHS
+  1650918045U, // <6,6,0,u>: Cost 2 vsldoi8 <6,6,6,6>, LHS
   3325358368U, // <6,6,1,0>: Cost 4 vmrghw <6,1,7,1>, <6,0,1,1>
-  3373148273U, // <6,6,1,1>: Cost 3 vmrglw <2,u,6,1>, <2,u,6,1>
-  3798401942U, // <6,6,1,2>: Cost 3 vsldoi8 <6,6,6,6>, <1,2,3,0>
+  2299406449U, // <6,6,1,1>: Cost 3 vmrglw <2,u,6,1>, <2,u,6,1>
+  2724660118U, // <6,6,1,2>: Cost 3 vsldoi8 <6,6,6,6>, <1,2,3,0>
   3373148518U, // <6,6,1,3>: Cost 4 vmrglw <2,u,6,1>, <3,2,6,3>
   3834253712U, // <6,6,1,4>: Cost 4 vsldoi12 <1,4,5,6>, <6,1,4,5>
   3373147953U, // <6,6,1,5>: Cost 4 vmrglw <2,u,6,1>, <2,4,6,5>
-  3397038904U, // <6,6,1,6>: Cost 3 vmrglw <6,u,6,1>, <6,6,6,6>
-  3373149494U, // <6,6,1,7>: Cost 3 vmrglw <2,u,6,1>, RHS
-  3373149495U, // <6,6,1,u>: Cost 3 vmrglw <2,u,6,1>, RHS
-  3326038313U, // <6,6,2,0>: Cost 3 vmrghw <6,2,7,3>, <6,0,2,1>
+  2323297080U, // <6,6,1,6>: Cost 3 vmrglw <6,u,6,1>, <6,6,6,6>
+  2299407670U, // <6,6,1,7>: Cost 3 vmrglw <2,u,6,1>, RHS
+  2299407671U, // <6,6,1,u>: Cost 3 vmrglw <2,u,6,1>, RHS
+  2252296489U, // <6,6,2,0>: Cost 3 vmrghw <6,2,7,3>, <6,0,2,1>
   3326038394U, // <6,6,2,1>: Cost 4 vmrghw <6,2,7,3>, <6,1,2,1>
-  2252296698U, // <6,6,2,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
-  3798402726U, // <6,6,2,3>: Cost 3 vsldoi8 <6,6,6,6>, <2,3,0,1>
-  3326038641U, // <6,6,2,4>: Cost 3 vmrghw <6,2,7,3>, <6,4,2,5>
+  1178554874U, // <6,6,2,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
+  2724660902U, // <6,6,2,3>: Cost 3 vsldoi8 <6,6,6,6>, <2,3,0,1>
+  2252296817U, // <6,6,2,4>: Cost 3 vmrghw <6,2,7,3>, <6,4,2,5>
   3840741864U, // <6,6,2,5>: Cost 4 vsldoi12 <2,5,3,6>, <6,2,5,3>
-  3326038800U, // <6,6,2,6>: Cost 3 vmrghw <6,2,7,3>, <6,6,2,2>
-  3859616250U, // <6,6,2,7>: Cost 3 vsldoi12 <5,6,7,6>, <6,2,7,3>
-  2252296698U, // <6,6,2,u>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
-  3798403222U, // <6,6,3,0>: Cost 3 vsldoi8 <6,6,6,6>, <3,0,1,2>
+  2252296976U, // <6,6,2,6>: Cost 3 vmrghw <6,2,7,3>, <6,6,2,2>
+  2785874426U, // <6,6,2,7>: Cost 3 vsldoi12 <5,6,7,6>, <6,2,7,3>
+  1178554874U, // <6,6,2,u>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
+  2724661398U, // <6,6,3,0>: Cost 3 vsldoi8 <6,6,6,6>, <3,0,1,2>
   3375154665U, // <6,6,3,1>: Cost 4 vmrglw <3,2,6,3>, <2,0,6,1>
   3375154909U, // <6,6,3,2>: Cost 4 vmrglw <3,2,6,3>, <2,3,6,2>
-  3375155558U, // <6,6,3,3>: Cost 3 vmrglw <3,2,6,3>, <3,2,6,3>
-  3846197810U, // <6,6,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <6,3,4,5>
+  2301413734U, // <6,6,3,3>: Cost 3 vmrglw <3,2,6,3>, <3,2,6,3>
+  2772455986U, // <6,6,3,4>: Cost 3 vsldoi12 <3,4,5,6>, <6,3,4,5>
   3375154993U, // <6,6,3,5>: Cost 4 vmrglw <3,2,6,3>, <2,4,6,5>
-  3397055288U, // <6,6,3,6>: Cost 3 vmrglw <6,u,6,3>, <6,6,6,6>
-  3375156534U, // <6,6,3,7>: Cost 3 vmrglw <3,2,6,3>, RHS
-  3375156535U, // <6,6,3,u>: Cost 3 vmrglw <3,2,6,3>, RHS
-  3798403986U, // <6,6,4,0>: Cost 3 vsldoi8 <6,6,6,6>, <4,0,5,1>
+  2323313464U, // <6,6,3,6>: Cost 3 vmrglw <6,u,6,3>, <6,6,6,6>
+  2301414710U, // <6,6,3,7>: Cost 3 vmrglw <3,2,6,3>, RHS
+  2301414711U, // <6,6,3,u>: Cost 3 vmrglw <3,2,6,3>, RHS
+  2724662162U, // <6,6,4,0>: Cost 3 vsldoi8 <6,6,6,6>, <4,0,5,1>
   3326939559U, // <6,6,4,1>: Cost 4 vmrghw <6,4,1,5>, <6,1,7,1>
-  3327013370U, // <6,6,4,2>: Cost 3 vmrghw <6,4,2,5>, <6,2,7,3>
+  2253271546U, // <6,6,4,2>: Cost 3 vmrghw <6,4,2,5>, <6,2,7,3>
   3383127346U, // <6,6,4,3>: Cost 4 vmrglw <4,5,6,4>, <4,5,6,3>
-  3383127347U, // <6,6,4,4>: Cost 3 vmrglw <4,5,6,4>, <4,5,6,4>
-  2724662582U, // <6,6,4,5>: Cost 2 vsldoi8 <6,6,6,6>, RHS
-  3798404477U, // <6,6,4,6>: Cost 3 vsldoi8 <6,6,6,6>, <4,6,5,6>
-  3383127350U, // <6,6,4,7>: Cost 3 vmrglw <4,5,6,4>, RHS
-  2724662825U, // <6,6,4,u>: Cost 2 vsldoi8 <6,6,6,6>, RHS
+  2309385523U, // <6,6,4,4>: Cost 3 vmrglw <4,5,6,4>, <4,5,6,4>
+  1650920758U, // <6,6,4,5>: Cost 2 vsldoi8 <6,6,6,6>, RHS
+  2724662653U, // <6,6,4,6>: Cost 3 vsldoi8 <6,6,6,6>, <4,6,5,6>
+  2309385526U, // <6,6,4,7>: Cost 3 vmrglw <4,5,6,4>, RHS
+  1650921001U, // <6,6,4,u>: Cost 2 vsldoi8 <6,6,6,6>, RHS
   3725312102U, // <6,6,5,0>: Cost 4 vsldoi4 <5,6,6,5>, LHS
   3373180393U, // <6,6,5,1>: Cost 4 vmrglw <2,u,6,5>, <2,0,6,1>
   3791769368U, // <6,6,5,2>: Cost 4 vsldoi8 <5,5,6,6>, <5,2,6,3>
   3373181286U, // <6,6,5,3>: Cost 4 vmrglw <2,u,6,5>, <3,2,6,3>
   3725315382U, // <6,6,5,4>: Cost 4 vsldoi4 <5,6,6,5>, RHS
-  3373181045U, // <6,6,5,5>: Cost 3 vmrglw <2,u,6,5>, <2,u,6,5>
-  3798405218U, // <6,6,5,6>: Cost 3 vsldoi8 <6,6,6,6>, <5,6,7,0>
-  3373182262U, // <6,6,5,7>: Cost 3 vmrglw <2,u,6,5>, RHS
-  3373182263U, // <6,6,5,u>: Cost 3 vmrglw <2,u,6,5>, RHS
-  2657550438U, // <6,6,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
-  3395752269U, // <6,6,6,1>: Cost 3 vmrglw <6,6,6,6>, <6,0,6,1>
-  3328315898U, // <6,6,6,2>: Cost 3 vmrghw <6,6,2,2>, <6,2,7,3>
-  3395752433U, // <6,6,6,3>: Cost 3 vmrglw <6,6,6,6>, <6,2,6,3>
-  2657553718U, // <6,6,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
-  3395752597U, // <6,6,6,5>: Cost 3 vmrglw <6,6,6,6>, <6,4,6,5>
-  1436994870U, // <6,6,6,6>: Cost 1 vspltisw2 RHS
-  2322009398U, // <6,6,6,7>: Cost 2 vmrglw <6,6,6,6>, RHS
-  1436994870U, // <6,6,6,u>: Cost 1 vspltisw2 RHS
-  3383151919U, // <6,6,7,0>: Cost 3 vmrglw RHS, <4,5,6,0>
-  3383150057U, // <6,6,7,1>: Cost 3 vmrglw RHS, <2,0,6,1>
-  3385144197U, // <6,6,7,2>: Cost 3 vmrglw RHS, <6,7,6,2>
-  3383150950U, // <6,6,7,3>: Cost 3 vmrglw RHS, <3,2,6,3>
-  3383151923U, // <6,6,7,4>: Cost 3 vmrglw RHS, <4,5,6,4>
-  3383150385U, // <6,6,7,5>: Cost 3 vmrglw RHS, <2,4,6,5>
-  2311402296U, // <6,6,7,6>: Cost 2 vmrglw RHS, <6,6,6,6>
-  1235668278U, // <6,6,7,7>: Cost 1 vmrglw RHS, RHS
-  1235668279U, // <6,6,7,u>: Cost 1 vmrglw RHS, RHS
-  2657550438U, // <6,6,u,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
-  2724665134U, // <6,6,u,1>: Cost 2 vsldoi8 <6,6,6,6>, LHS
-  2252296698U, // <6,6,u,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
-  3383159142U, // <6,6,u,3>: Cost 3 vmrglw RHS, <3,2,6,3>
-  2657553718U, // <6,6,u,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
-  2724665498U, // <6,6,u,5>: Cost 2 vsldoi8 <6,6,6,6>, RHS
-  1436994870U, // <6,6,u,6>: Cost 1 vspltisw2 RHS
-  1235676470U, // <6,6,u,7>: Cost 1 vmrglw RHS, RHS
-  1235676471U, // <6,6,u,u>: Cost 1 vmrglw RHS, RHS
-  2712059904U, // <6,7,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
-  1638318182U, // <6,7,0,1>: Cost 1 vsldoi8 RHS, LHS
-  3785801901U, // <6,7,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
-  3785801980U, // <6,7,0,3>: Cost 3 vsldoi8 RHS, <0,3,1,0>
-  2712060242U, // <6,7,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
-  2651607138U, // <6,7,0,5>: Cost 2 vsldoi4 <5,6,7,0>, <5,6,7,0>
-  3785802230U, // <6,7,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
-  3725349882U, // <6,7,0,7>: Cost 3 vsldoi4 <5,6,7,0>, <7,0,1,2>
-  1638318749U, // <6,7,0,u>: Cost 1 vsldoi8 RHS, LHS
-  3785802467U, // <6,7,1,0>: Cost 3 vsldoi8 RHS, <1,0,1,1>
-  2712060724U, // <6,7,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
-  2712060822U, // <6,7,1,2>: Cost 2 vsldoi8 RHS, <1,2,3,0>
+  2299439221U, // <6,6,5,5>: Cost 3 vmrglw <2,u,6,5>, <2,u,6,5>
+  2724663394U, // <6,6,5,6>: Cost 3 vsldoi8 <6,6,6,6>, <5,6,7,0>
+  2299440438U, // <6,6,5,7>: Cost 3 vmrglw <2,u,6,5>, RHS
+  2299440439U, // <6,6,5,u>: Cost 3 vmrglw <2,u,6,5>, RHS
+  1583808614U, // <6,6,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
+  2322010445U, // <6,6,6,1>: Cost 3 vmrglw <6,6,6,6>, <6,0,6,1>
+  2254574074U, // <6,6,6,2>: Cost 3 vmrghw <6,6,2,2>, <6,2,7,3>
+  2322010609U, // <6,6,6,3>: Cost 3 vmrglw <6,6,6,6>, <6,2,6,3>
+  1583811894U, // <6,6,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
+  2322010773U, // <6,6,6,5>: Cost 3 vmrglw <6,6,6,6>, <6,4,6,5>
+  363253046U,  // <6,6,6,6>: Cost 1 vspltisw2 RHS
+  1248267574U, // <6,6,6,7>: Cost 2 vmrglw <6,6,6,6>, RHS
+  363253046U,  // <6,6,6,u>: Cost 1 vspltisw2 RHS
+  2309410095U, // <6,6,7,0>: Cost 3 vmrglw RHS, <4,5,6,0>
+  2309408233U, // <6,6,7,1>: Cost 3 vmrglw RHS, <2,0,6,1>
+  2311402373U, // <6,6,7,2>: Cost 3 vmrglw RHS, <6,7,6,2>
+  2309409126U, // <6,6,7,3>: Cost 3 vmrglw RHS, <3,2,6,3>
+  2309410099U, // <6,6,7,4>: Cost 3 vmrglw RHS, <4,5,6,4>
+  2309408561U, // <6,6,7,5>: Cost 3 vmrglw RHS, <2,4,6,5>
+  1237660472U, // <6,6,7,6>: Cost 2 vmrglw RHS, <6,6,6,6>
+  161926454U,  // <6,6,7,7>: Cost 1 vmrglw RHS, RHS
+  161926455U,  // <6,6,7,u>: Cost 1 vmrglw RHS, RHS
+  1583808614U, // <6,6,u,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
+  1650923310U, // <6,6,u,1>: Cost 2 vsldoi8 <6,6,6,6>, LHS
+  1178554874U, // <6,6,u,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
+  2309417318U, // <6,6,u,3>: Cost 3 vmrglw RHS, <3,2,6,3>
+  1583811894U, // <6,6,u,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
+  1650923674U, // <6,6,u,5>: Cost 2 vsldoi8 <6,6,6,6>, RHS
+  363253046U,  // <6,6,u,6>: Cost 1 vspltisw2 RHS
+  161934646U,  // <6,6,u,7>: Cost 1 vmrglw RHS, RHS
+  161934647U,  // <6,6,u,u>: Cost 1 vmrglw RHS, RHS
+  1638318080U, // <6,7,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
+  564576358U,  // <6,7,0,1>: Cost 1 vsldoi8 RHS, LHS
+  2712060077U, // <6,7,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
+  2712060156U, // <6,7,0,3>: Cost 3 vsldoi8 RHS, <0,3,1,0>
+  1638318418U, // <6,7,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
+  1577865314U, // <6,7,0,5>: Cost 2 vsldoi4 <5,6,7,0>, <5,6,7,0>
+  2712060406U, // <6,7,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
+  2651608058U, // <6,7,0,7>: Cost 3 vsldoi4 <5,6,7,0>, <7,0,1,2>
+  564576925U,  // <6,7,0,u>: Cost 1 vsldoi8 RHS, LHS
+  2712060643U, // <6,7,1,0>: Cost 3 vsldoi8 RHS, <1,0,1,1>
+  1638318900U, // <6,7,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
+  1638318998U, // <6,7,1,2>: Cost 2 vsldoi8 RHS, <1,2,3,0>
   3766559753U, // <6,7,1,3>: Cost 4 vsldoi8 <1,3,6,7>, <1,3,6,7>
-  3785802795U, // <6,7,1,4>: Cost 3 vsldoi8 RHS, <1,4,1,5>
-  3785802863U, // <6,7,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
-  3785802959U, // <6,7,1,6>: Cost 3 vsldoi8 RHS, <1,6,1,7>
+  2712060971U, // <6,7,1,4>: Cost 3 vsldoi8 RHS, <1,4,1,5>
+  2712061039U, // <6,7,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
+  2712061135U, // <6,7,1,6>: Cost 3 vsldoi8 RHS, <1,6,1,7>
   3373148612U, // <6,7,1,7>: Cost 4 vmrglw <2,u,6,1>, <3,3,7,7>
-  2712061308U, // <6,7,1,u>: Cost 2 vsldoi8 RHS, <1,u,3,0>
-  3785803197U, // <6,7,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
-  3785803295U, // <6,7,2,1>: Cost 3 vsldoi8 RHS, <2,1,3,1>
-  2712061544U, // <6,7,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
-  2712061606U, // <6,7,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
-  3785803533U, // <6,7,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
-  3785803624U, // <6,7,2,5>: Cost 3 vsldoi8 RHS, <2,5,3,6>
-  2712061882U, // <6,7,2,6>: Cost 2 vsldoi8 RHS, <2,6,3,7>
-  3326039660U, // <6,7,2,7>: Cost 3 vmrghw <6,2,7,3>, <7,7,7,7>
-  2712062011U, // <6,7,2,u>: Cost 2 vsldoi8 RHS, <2,u,0,1>
-  2712062102U, // <6,7,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
-  3785804006U, // <6,7,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
-  3785804080U, // <6,7,3,2>: Cost 3 vsldoi8 RHS, <3,2,0,3>
-  2712062364U, // <6,7,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
-  2712062466U, // <6,7,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
-  3785804370U, // <6,7,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
-  3785804408U, // <6,7,3,6>: Cost 3 vsldoi8 RHS, <3,6,0,7>
-  3785804483U, // <6,7,3,7>: Cost 3 vsldoi8 RHS, <3,7,0,1>
-  2712062750U, // <6,7,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
-  2712062866U, // <6,7,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
-  3785804746U, // <6,7,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
-  3785804853U, // <6,7,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
-  3785804932U, // <6,7,4,3>: Cost 3 vsldoi8 RHS, <4,3,5,0>
-  2712063184U, // <6,7,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
-  1638321462U, // <6,7,4,5>: Cost 1 vsldoi8 RHS, RHS
-  3785805181U, // <6,7,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,6>
-  3785805263U, // <6,7,4,7>: Cost 3 vsldoi8 RHS, <4,7,5,7>
-  1638321705U, // <6,7,4,u>: Cost 1 vsldoi8 RHS, RHS
-  3785805384U, // <6,7,5,0>: Cost 3 vsldoi8 RHS, <5,0,1,2>
-  3787796111U, // <6,7,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
-  3785805566U, // <6,7,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
+  1638319484U, // <6,7,1,u>: Cost 2 vsldoi8 RHS, <1,u,3,0>
+  2712061373U, // <6,7,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
+  2712061471U, // <6,7,2,1>: Cost 3 vsldoi8 RHS, <2,1,3,1>
+  1638319720U, // <6,7,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
+  1638319782U, // <6,7,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
+  2712061709U, // <6,7,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
+  2712061800U, // <6,7,2,5>: Cost 3 vsldoi8 RHS, <2,5,3,6>
+  1638320058U, // <6,7,2,6>: Cost 2 vsldoi8 RHS, <2,6,3,7>
+  2252297836U, // <6,7,2,7>: Cost 3 vmrghw <6,2,7,3>, <7,7,7,7>
+  1638320187U, // <6,7,2,u>: Cost 2 vsldoi8 RHS, <2,u,0,1>
+  1638320278U, // <6,7,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
+  2712062182U, // <6,7,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
+  2712062256U, // <6,7,3,2>: Cost 3 vsldoi8 RHS, <3,2,0,3>
+  1638320540U, // <6,7,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
+  1638320642U, // <6,7,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
+  2712062546U, // <6,7,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
+  2712062584U, // <6,7,3,6>: Cost 3 vsldoi8 RHS, <3,6,0,7>
+  2712062659U, // <6,7,3,7>: Cost 3 vsldoi8 RHS, <3,7,0,1>
+  1638320926U, // <6,7,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
+  1638321042U, // <6,7,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
+  2712062922U, // <6,7,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
+  2712063029U, // <6,7,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
+  2712063108U, // <6,7,4,3>: Cost 3 vsldoi8 RHS, <4,3,5,0>
+  1638321360U, // <6,7,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
+  564579638U,  // <6,7,4,5>: Cost 1 vsldoi8 RHS, RHS
+  2712063357U, // <6,7,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,6>
+  2712063439U, // <6,7,4,7>: Cost 3 vsldoi8 RHS, <4,7,5,7>
+  564579881U,  // <6,7,4,u>: Cost 1 vsldoi8 RHS, RHS
+  2712063560U, // <6,7,5,0>: Cost 3 vsldoi8 RHS, <5,0,1,2>
+  2714054287U, // <6,7,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
+  2712063742U, // <6,7,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
   3373181295U, // <6,7,5,3>: Cost 4 vmrglw <2,u,6,5>, <3,2,7,3>
-  3785805748U, // <6,7,5,4>: Cost 3 vsldoi8 RHS, <5,4,5,6>
-  2712064004U, // <6,7,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
-  2712064098U, // <6,7,5,6>: Cost 2 vsldoi8 RHS, <5,6,7,0>
+  2712063924U, // <6,7,5,4>: Cost 3 vsldoi8 RHS, <5,4,5,6>
+  1638322180U, // <6,7,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
+  1638322274U, // <6,7,5,6>: Cost 2 vsldoi8 RHS, <5,6,7,0>
   3373181380U, // <6,7,5,7>: Cost 4 vmrglw <2,u,6,5>, <3,3,7,7>
-  2714054916U, // <6,7,5,u>: Cost 2 vsldoi8 RHS, <5,u,7,0>
-  3785806113U, // <6,7,6,0>: Cost 3 vsldoi8 RHS, <6,0,1,2>
-  3785806247U, // <6,7,6,1>: Cost 3 vsldoi8 RHS, <6,1,7,1>
-  2712064506U, // <6,7,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
-  3785806386U, // <6,7,6,3>: Cost 3 vsldoi8 RHS, <6,3,4,5>
-  3785806477U, // <6,7,6,4>: Cost 3 vsldoi8 RHS, <6,4,5,6>
-  3785806571U, // <6,7,6,5>: Cost 3 vsldoi8 RHS, <6,5,7,1>
-  2712064824U, // <6,7,6,6>: Cost 2 vsldoi8 RHS, <6,6,6,6>
-  2712064846U, // <6,7,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
-  2712064992U, // <6,7,6,u>: Cost 2 vsldoi8 RHS, <6,u,7,3>
-  2311401570U, // <6,7,7,0>: Cost 2 vmrglw RHS, <5,6,7,0>
-  3383152982U, // <6,7,7,1>: Cost 3 vmrglw RHS, <6,0,7,1>
-  3713460154U, // <6,7,7,2>: Cost 3 vsldoi4 <3,6,7,7>, <2,6,3,7>
-  2309411322U, // <6,7,7,3>: Cost 2 vmrglw RHS, <6,2,7,3>
-  2311401574U, // <6,7,7,4>: Cost 2 vmrglw RHS, <5,6,7,4>
-  3383153067U, // <6,7,7,5>: Cost 3 vmrglw RHS, <6,1,7,5>
-  2657637186U, // <6,7,7,6>: Cost 2 vsldoi4 <6,6,7,7>, <6,6,7,7>
-  2309411650U, // <6,7,7,7>: Cost 2 vmrglw RHS, <6,6,7,7>
-  2309411327U, // <6,7,7,u>: Cost 2 vmrglw RHS, <6,2,7,u>
-  2712065747U, // <6,7,u,0>: Cost 2 vsldoi8 RHS, <u,0,1,2>
-  1638324014U, // <6,7,u,1>: Cost 1 vsldoi8 RHS, LHS
-  2712065925U, // <6,7,u,2>: Cost 2 vsldoi8 RHS, <u,2,3,0>
-  2712065980U, // <6,7,u,3>: Cost 2 vsldoi8 RHS, <u,3,0,1>
-  2712066111U, // <6,7,u,4>: Cost 2 vsldoi8 RHS, <u,4,5,6>
-  1638324378U, // <6,7,u,5>: Cost 1 vsldoi8 RHS, RHS
-  2712066256U, // <6,7,u,6>: Cost 2 vsldoi8 RHS, <u,6,3,7>
-  2309419842U, // <6,7,u,7>: Cost 2 vmrglw RHS, <6,6,7,7>
-  1638324581U, // <6,7,u,u>: Cost 1 vsldoi8 RHS, LHS
-  2712068096U, // <6,u,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
-  1638326374U, // <6,u,0,1>: Cost 1 vsldoi8 RHS, LHS
-  3785810093U, // <6,u,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
-  3383091356U, // <6,u,0,3>: Cost 3 vmrglw <4,5,6,0>, LHS
-  2712068434U, // <6,u,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
-  2651680875U, // <6,u,0,5>: Cost 2 vsldoi4 <5,6,u,0>, <5,6,u,0>
-  3785810422U, // <6,u,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
-  3383094600U, // <6,u,0,7>: Cost 3 vmrglw <4,5,6,0>, RHS
-  1638326941U, // <6,u,0,u>: Cost 1 vsldoi8 RHS, LHS
-  3785810659U, // <6,u,1,0>: Cost 3 vsldoi8 RHS, <1,0,1,1>
-  2712068916U, // <6,u,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
-  2772457262U, // <6,u,1,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
-  3373146268U, // <6,u,1,3>: Cost 3 vmrglw <2,u,6,1>, LHS
-  3785810987U, // <6,u,1,4>: Cost 3 vsldoi8 RHS, <1,4,1,5>
-  3785811055U, // <6,u,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
-  3785811151U, // <6,u,1,6>: Cost 3 vsldoi8 RHS, <1,6,1,7>
-  3373149512U, // <6,u,1,7>: Cost 3 vmrglw <2,u,6,1>, RHS
-  2772457316U, // <6,u,1,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
-  3785811389U, // <6,u,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
-  2252298030U, // <6,u,2,1>: Cost 2 vmrghw <6,2,7,3>, LHS
-  2712069736U, // <6,u,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
-  2712069798U, // <6,u,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
-  3785811725U, // <6,u,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
-  2252298394U, // <6,u,2,5>: Cost 2 vmrghw <6,2,7,3>, RHS
-  2712070074U, // <6,u,2,6>: Cost 2 vsldoi8 RHS, <2,6,3,7>
-  3326040320U, // <6,u,2,7>: Cost 3 vmrghw <6,2,7,3>, <u,7,0,1>
-  2712070203U, // <6,u,2,u>: Cost 2 vsldoi8 RHS, <2,u,0,1>
-  2712070294U, // <6,u,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
-  3785812198U, // <6,u,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
-  3777849707U, // <6,u,3,2>: Cost 3 vsldoi8 <3,2,6,u>, <3,2,6,u>
-  2712070556U, // <6,u,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
-  2712070658U, // <6,u,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
-  3785812562U, // <6,u,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
-  3785812600U, // <6,u,3,6>: Cost 3 vsldoi8 RHS, <3,6,0,7>
-  3375156552U, // <6,u,3,7>: Cost 3 vmrglw <3,2,6,3>, RHS
-  2712070942U, // <6,u,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
-  2712071058U, // <6,u,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
-  3785812938U, // <6,u,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
-  3785813045U, // <6,u,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
-  3383124124U, // <6,u,4,3>: Cost 3 vmrglw <4,5,6,4>, LHS
-  2712071376U, // <6,u,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
-  1638329655U, // <6,u,4,5>: Cost 1 vsldoi8 RHS, RHS
-  3785813369U, // <6,u,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,2>
-  3383127368U, // <6,u,4,7>: Cost 3 vmrglw <4,5,6,4>, RHS
-  1638329897U, // <6,u,4,u>: Cost 1 vsldoi8 RHS, RHS
-  3785813576U, // <6,u,5,0>: Cost 3 vsldoi8 RHS, <5,0,1,2>
-  3787804303U, // <6,u,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
-  3785813758U, // <6,u,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
-  3373179036U, // <6,u,5,3>: Cost 3 vmrglw <2,u,6,5>, LHS
-  3785813940U, // <6,u,5,4>: Cost 3 vsldoi8 RHS, <5,4,5,6>
-  2712072196U, // <6,u,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
-  2772457626U, // <6,u,5,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
-  3373182280U, // <6,u,5,7>: Cost 3 vmrglw <2,u,6,5>, RHS
-  2772457644U, // <6,u,5,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
-  2657550438U, // <6,u,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
-  2254903086U, // <6,u,6,1>: Cost 2 vmrghw <6,6,6,6>, LHS
-  2712072698U, // <6,u,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
-  2322006172U, // <6,u,6,3>: Cost 2 vmrglw <6,6,6,6>, LHS
-  2657553718U, // <6,u,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
-  2254903450U, // <6,u,6,5>: Cost 2 vmrghw <6,6,6,6>, RHS
-  1436994870U, // <6,u,6,6>: Cost 1 vspltisw2 RHS
-  2712073038U, // <6,u,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
-  1436994870U, // <6,u,6,u>: Cost 1 vspltisw2 RHS
-  2633818214U, // <6,u,7,0>: Cost 2 vsldoi4 <2,6,u,7>, LHS
-  2309406793U, // <6,u,7,1>: Cost 2 vmrglw RHS, <0,0,u,1>
-  2633820135U, // <6,u,7,2>: Cost 2 vsldoi4 <2,6,u,7>, <2,6,u,7>
-  1235665052U, // <6,u,7,3>: Cost 1 vmrglw RHS, LHS
-  2633821494U, // <6,u,7,4>: Cost 2 vsldoi4 <2,6,u,7>, RHS
-  2309407121U, // <6,u,7,5>: Cost 2 vmrglw RHS, <0,4,u,5>
-  2309409309U, // <6,u,7,6>: Cost 2 vmrglw RHS, <3,4,u,6>
-  1235668296U, // <6,u,7,7>: Cost 1 vmrglw RHS, RHS
-  1235665057U, // <6,u,7,u>: Cost 1 vmrglw RHS, LHS
-  2633826406U, // <6,u,u,0>: Cost 2 vsldoi4 <2,6,u,u>, LHS
-  1638332206U, // <6,u,u,1>: Cost 1 vsldoi8 RHS, LHS
-  2633828328U, // <6,u,u,2>: Cost 2 vsldoi4 <2,6,u,u>, <2,6,u,u>
-  1235673244U, // <6,u,u,3>: Cost 1 vmrglw RHS, LHS
-  2633829686U, // <6,u,u,4>: Cost 2 vsldoi4 <2,6,u,u>, RHS
-  1638332570U, // <6,u,u,5>: Cost 1 vsldoi8 RHS, RHS
-  1436994870U, // <6,u,u,6>: Cost 1 vspltisw2 RHS
-  1235676488U, // <6,u,u,7>: Cost 1 vmrglw RHS, RHS
-  1235673249U, // <6,u,u,u>: Cost 1 vmrglw RHS, LHS
-  2779168768U, // <7,0,0,0>: Cost 2 vsldoi12 RHS, <0,0,0,0>
-  2779168778U, // <7,0,0,1>: Cost 2 vsldoi12 RHS, <0,0,1,1>
+  1640313092U, // <6,7,5,u>: Cost 2 vsldoi8 RHS, <5,u,7,0>
+  2712064289U, // <6,7,6,0>: Cost 3 vsldoi8 RHS, <6,0,1,2>
+  2712064423U, // <6,7,6,1>: Cost 3 vsldoi8 RHS, <6,1,7,1>
+  1638322682U, // <6,7,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
+  2712064562U, // <6,7,6,3>: Cost 3 vsldoi8 RHS, <6,3,4,5>
+  2712064653U, // <6,7,6,4>: Cost 3 vsldoi8 RHS, <6,4,5,6>
+  2712064747U, // <6,7,6,5>: Cost 3 vsldoi8 RHS, <6,5,7,1>
+  1638323000U, // <6,7,6,6>: Cost 2 vsldoi8 RHS, <6,6,6,6>
+  1638323022U, // <6,7,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
+  1638323168U, // <6,7,6,u>: Cost 2 vsldoi8 RHS, <6,u,7,3>
+  1237659746U, // <6,7,7,0>: Cost 2 vmrglw RHS, <5,6,7,0>
+  2309411158U, // <6,7,7,1>: Cost 3 vmrglw RHS, <6,0,7,1>
+  2639718330U, // <6,7,7,2>: Cost 3 vsldoi4 <3,6,7,7>, <2,6,3,7>
+  1235669498U, // <6,7,7,3>: Cost 2 vmrglw RHS, <6,2,7,3>
+  1237659750U, // <6,7,7,4>: Cost 2 vmrglw RHS, <5,6,7,4>
+  2309411243U, // <6,7,7,5>: Cost 3 vmrglw RHS, <6,1,7,5>
+  1583895362U, // <6,7,7,6>: Cost 2 vsldoi4 <6,6,7,7>, <6,6,7,7>
+  1235669826U, // <6,7,7,7>: Cost 2 vmrglw RHS, <6,6,7,7>
+  1235669503U, // <6,7,7,u>: Cost 2 vmrglw RHS, <6,2,7,u>
+  1638323923U, // <6,7,u,0>: Cost 2 vsldoi8 RHS, <u,0,1,2>
+  564582190U,  // <6,7,u,1>: Cost 1 vsldoi8 RHS, LHS
+  1638324101U, // <6,7,u,2>: Cost 2 vsldoi8 RHS, <u,2,3,0>
+  1638324156U, // <6,7,u,3>: Cost 2 vsldoi8 RHS, <u,3,0,1>
+  1638324287U, // <6,7,u,4>: Cost 2 vsldoi8 RHS, <u,4,5,6>
+  564582554U,  // <6,7,u,5>: Cost 1 vsldoi8 RHS, RHS
+  1638324432U, // <6,7,u,6>: Cost 2 vsldoi8 RHS, <u,6,3,7>
+  1235678018U, // <6,7,u,7>: Cost 2 vmrglw RHS, <6,6,7,7>
+  564582757U,  // <6,7,u,u>: Cost 1 vsldoi8 RHS, LHS
+  1638326272U, // <6,u,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
+  564584550U,  // <6,u,0,1>: Cost 1 vsldoi8 RHS, LHS
+  2712068269U, // <6,u,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
+  2309349532U, // <6,u,0,3>: Cost 3 vmrglw <4,5,6,0>, LHS
+  1638326610U, // <6,u,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
+  1577939051U, // <6,u,0,5>: Cost 2 vsldoi4 <5,6,u,0>, <5,6,u,0>
+  2712068598U, // <6,u,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
+  2309352776U, // <6,u,0,7>: Cost 3 vmrglw <4,5,6,0>, RHS
+  564585117U,  // <6,u,0,u>: Cost 1 vsldoi8 RHS, LHS
+  2712068835U, // <6,u,1,0>: Cost 3 vsldoi8 RHS, <1,0,1,1>
+  1638327092U, // <6,u,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
+  1698715438U, // <6,u,1,2>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2299404444U, // <6,u,1,3>: Cost 3 vmrglw <2,u,6,1>, LHS
+  2712069163U, // <6,u,1,4>: Cost 3 vsldoi8 RHS, <1,4,1,5>
+  2712069231U, // <6,u,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
+  2712069327U, // <6,u,1,6>: Cost 3 vsldoi8 RHS, <1,6,1,7>
+  2299407688U, // <6,u,1,7>: Cost 3 vmrglw <2,u,6,1>, RHS
+  1698715492U, // <6,u,1,u>: Cost 2 vsldoi12 <3,4,5,6>, LHS
+  2712069565U, // <6,u,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
+  1178556206U, // <6,u,2,1>: Cost 2 vmrghw <6,2,7,3>, LHS
+  1638327912U, // <6,u,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
+  1638327974U, // <6,u,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
+  2712069901U, // <6,u,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
+  1178556570U, // <6,u,2,5>: Cost 2 vmrghw <6,2,7,3>, RHS
+  1638328250U, // <6,u,2,6>: Cost 2 vsldoi8 RHS, <2,6,3,7>
+  2252298496U, // <6,u,2,7>: Cost 3 vmrghw <6,2,7,3>, <u,7,0,1>
+  1638328379U, // <6,u,2,u>: Cost 2 vsldoi8 RHS, <2,u,0,1>
+  1638328470U, // <6,u,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
+  2712070374U, // <6,u,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
+  2704107883U, // <6,u,3,2>: Cost 3 vsldoi8 <3,2,6,u>, <3,2,6,u>
+  1638328732U, // <6,u,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
+  1638328834U, // <6,u,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
+  2712070738U, // <6,u,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
+  2712070776U, // <6,u,3,6>: Cost 3 vsldoi8 RHS, <3,6,0,7>
+  2301414728U, // <6,u,3,7>: Cost 3 vmrglw <3,2,6,3>, RHS
+  1638329118U, // <6,u,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
+  1638329234U, // <6,u,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
+  2712071114U, // <6,u,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
+  2712071221U, // <6,u,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
+  2309382300U, // <6,u,4,3>: Cost 3 vmrglw <4,5,6,4>, LHS
+  1638329552U, // <6,u,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
+  564587831U,  // <6,u,4,5>: Cost 1 vsldoi8 RHS, RHS
+  2712071545U, // <6,u,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,2>
+  2309385544U, // <6,u,4,7>: Cost 3 vmrglw <4,5,6,4>, RHS
+  564588073U,  // <6,u,4,u>: Cost 1 vsldoi8 RHS, RHS
+  2712071752U, // <6,u,5,0>: Cost 3 vsldoi8 RHS, <5,0,1,2>
+  2714062479U, // <6,u,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
+  2712071934U, // <6,u,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
+  2299437212U, // <6,u,5,3>: Cost 3 vmrglw <2,u,6,5>, LHS
+  2712072116U, // <6,u,5,4>: Cost 3 vsldoi8 RHS, <5,4,5,6>
+  1638330372U, // <6,u,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
+  1698715802U, // <6,u,5,6>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  2299440456U, // <6,u,5,7>: Cost 3 vmrglw <2,u,6,5>, RHS
+  1698715820U, // <6,u,5,u>: Cost 2 vsldoi12 <3,4,5,6>, RHS
+  1583808614U, // <6,u,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
+  1181161262U, // <6,u,6,1>: Cost 2 vmrghw <6,6,6,6>, LHS
+  1638330874U, // <6,u,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
+  1248264348U, // <6,u,6,3>: Cost 2 vmrglw <6,6,6,6>, LHS
+  1583811894U, // <6,u,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
+  1181161626U, // <6,u,6,5>: Cost 2 vmrghw <6,6,6,6>, RHS
+  363253046U,  // <6,u,6,6>: Cost 1 vspltisw2 RHS
+  1638331214U, // <6,u,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
+  363253046U,  // <6,u,6,u>: Cost 1 vspltisw2 RHS
+  1560076390U, // <6,u,7,0>: Cost 2 vsldoi4 <2,6,u,7>, LHS
+  1235664969U, // <6,u,7,1>: Cost 2 vmrglw RHS, <0,0,u,1>
+  1560078311U, // <6,u,7,2>: Cost 2 vsldoi4 <2,6,u,7>, <2,6,u,7>
+  161923228U,  // <6,u,7,3>: Cost 1 vmrglw RHS, LHS
+  1560079670U, // <6,u,7,4>: Cost 2 vsldoi4 <2,6,u,7>, RHS
+  1235665297U, // <6,u,7,5>: Cost 2 vmrglw RHS, <0,4,u,5>
+  1235667485U, // <6,u,7,6>: Cost 2 vmrglw RHS, <3,4,u,6>
+  161926472U,  // <6,u,7,7>: Cost 1 vmrglw RHS, RHS
+  161923233U,  // <6,u,7,u>: Cost 1 vmrglw RHS, LHS
+  1560084582U, // <6,u,u,0>: Cost 2 vsldoi4 <2,6,u,u>, LHS
+  564590382U,  // <6,u,u,1>: Cost 1 vsldoi8 RHS, LHS
+  1560086504U, // <6,u,u,2>: Cost 2 vsldoi4 <2,6,u,u>, <2,6,u,u>
+  161931420U,  // <6,u,u,3>: Cost 1 vmrglw RHS, LHS
+  1560087862U, // <6,u,u,4>: Cost 2 vsldoi4 <2,6,u,u>, RHS
+  564590746U,  // <6,u,u,5>: Cost 1 vsldoi8 RHS, RHS
+  363253046U,  // <6,u,u,6>: Cost 1 vspltisw2 RHS
+  161934664U,  // <6,u,u,7>: Cost 1 vmrglw RHS, RHS
+  161931425U,  // <6,u,u,u>: Cost 1 vmrglw RHS, LHS
+  1705426944U, // <7,0,0,0>: Cost 2 vsldoi12 RHS, <0,0,0,0>
+  1705426954U, // <7,0,0,1>: Cost 2 vsldoi12 RHS, <0,0,1,1>
   3713550266U, // <7,0,0,2>: Cost 4 vsldoi4 <3,7,0,0>, <2,6,3,7>
-  3389805716U, // <7,0,0,3>: Cost 3 vmrglw <5,6,7,0>, <7,2,0,3>
-  3852910629U, // <7,0,0,4>: Cost 3 vsldoi12 RHS, <0,0,4,1>
-  3737440354U, // <7,0,0,5>: Cost 3 vsldoi4 <7,7,0,0>, <5,6,7,0>
-  3731469133U, // <7,0,0,6>: Cost 3 vsldoi4 <6,7,0,0>, <6,7,0,0>
-  3389806044U, // <7,0,0,7>: Cost 3 vmrglw <5,6,7,0>, <7,6,0,7>
-  2779168841U, // <7,0,0,u>: Cost 2 vsldoi12 RHS, <0,0,u,1>
-  2657730662U, // <7,0,1,0>: Cost 2 vsldoi4 <6,7,0,1>, LHS
-  3852910683U, // <7,0,1,1>: Cost 3 vsldoi12 RHS, <0,1,1,1>
-  1705427046U, // <7,0,1,2>: Cost 1 vsldoi12 RHS, LHS
-  3713559235U, // <7,0,1,3>: Cost 3 vsldoi4 <3,7,0,1>, <3,7,0,1>
-  2657733942U, // <7,0,1,4>: Cost 2 vsldoi4 <6,7,0,1>, RHS
-  3731476484U, // <7,0,1,5>: Cost 3 vsldoi4 <6,7,0,1>, <5,5,5,5>
-  2657735502U, // <7,0,1,6>: Cost 2 vsldoi4 <6,7,0,1>, <6,7,0,1>
-  3731477496U, // <7,0,1,7>: Cost 3 vsldoi4 <6,7,0,1>, <7,0,1,0>
-  1705427100U, // <7,0,1,u>: Cost 1 vsldoi12 RHS, LHS
-  3852910757U, // <7,0,2,0>: Cost 3 vsldoi12 RHS, <0,2,0,3>
-  3841409201U, // <7,0,2,1>: Cost 3 vsldoi12 <2,6,3,7>, <0,2,1,6>
-  3792455272U, // <7,0,2,2>: Cost 3 vsldoi8 <5,6,7,0>, <2,2,2,2>
-  3792455334U, // <7,0,2,3>: Cost 3 vsldoi8 <5,6,7,0>, <2,3,0,1>
+  2316063892U, // <7,0,0,3>: Cost 3 vmrglw <5,6,7,0>, <7,2,0,3>
+  2779168805U, // <7,0,0,4>: Cost 3 vsldoi12 RHS, <0,0,4,1>
+  2663698530U, // <7,0,0,5>: Cost 3 vsldoi4 <7,7,0,0>, <5,6,7,0>
+  2657727309U, // <7,0,0,6>: Cost 3 vsldoi4 <6,7,0,0>, <6,7,0,0>
+  2316064220U, // <7,0,0,7>: Cost 3 vmrglw <5,6,7,0>, <7,6,0,7>
+  1705427017U, // <7,0,0,u>: Cost 2 vsldoi12 RHS, <0,0,u,1>
+  1583988838U, // <7,0,1,0>: Cost 2 vsldoi4 <6,7,0,1>, LHS
+  2779168859U, // <7,0,1,1>: Cost 3 vsldoi12 RHS, <0,1,1,1>
+  631685222U,  // <7,0,1,2>: Cost 1 vsldoi12 RHS, LHS
+  2639817411U, // <7,0,1,3>: Cost 3 vsldoi4 <3,7,0,1>, <3,7,0,1>
+  1583992118U, // <7,0,1,4>: Cost 2 vsldoi4 <6,7,0,1>, RHS
+  2657734660U, // <7,0,1,5>: Cost 3 vsldoi4 <6,7,0,1>, <5,5,5,5>
+  1583993678U, // <7,0,1,6>: Cost 2 vsldoi4 <6,7,0,1>, <6,7,0,1>
+  2657735672U, // <7,0,1,7>: Cost 3 vsldoi4 <6,7,0,1>, <7,0,1,0>
+  631685276U,  // <7,0,1,u>: Cost 1 vsldoi12 RHS, LHS
+  2779168933U, // <7,0,2,0>: Cost 3 vsldoi12 RHS, <0,2,0,3>
+  2767667377U, // <7,0,2,1>: Cost 3 vsldoi12 <2,6,3,7>, <0,2,1,6>
+  2718713448U, // <7,0,2,2>: Cost 3 vsldoi8 <5,6,7,0>, <2,2,2,2>
+  2718713510U, // <7,0,2,3>: Cost 3 vsldoi8 <5,6,7,0>, <2,3,0,1>
   3841409228U, // <7,0,2,4>: Cost 4 vsldoi12 <2,6,3,7>, <0,2,4,6>
   3852910802U, // <7,0,2,5>: Cost 4 vsldoi12 RHS, <0,2,5,3>
-  3792455610U, // <7,0,2,6>: Cost 3 vsldoi8 <5,6,7,0>, <2,6,3,7>
+  2718713786U, // <7,0,2,6>: Cost 3 vsldoi8 <5,6,7,0>, <2,6,3,7>
   3847160036U, // <7,0,2,7>: Cost 4 vsldoi12 <3,6,0,7>, <0,2,7,3>
-  3841409264U, // <7,0,2,u>: Cost 3 vsldoi12 <2,6,3,7>, <0,2,u,6>
-  3792455830U, // <7,0,3,0>: Cost 3 vsldoi8 <5,6,7,0>, <3,0,1,2>
-  3852910844U, // <7,0,3,1>: Cost 3 vsldoi12 RHS, <0,3,1,0>
+  2767667440U, // <7,0,2,u>: Cost 3 vsldoi12 <2,6,3,7>, <0,2,u,6>
+  2718714006U, // <7,0,3,0>: Cost 3 vsldoi8 <5,6,7,0>, <3,0,1,2>
+  2779169020U, // <7,0,3,1>: Cost 3 vsldoi12 RHS, <0,3,1,0>
   3852910853U, // <7,0,3,2>: Cost 4 vsldoi12 RHS, <0,3,2,0>
-  3792456092U, // <7,0,3,3>: Cost 3 vsldoi8 <5,6,7,0>, <3,3,3,3>
-  3792456194U, // <7,0,3,4>: Cost 3 vsldoi8 <5,6,7,0>, <3,4,5,6>
-  3792456285U, // <7,0,3,5>: Cost 3 vsldoi8 <5,6,7,0>, <3,5,6,7>
-  3780512432U, // <7,0,3,6>: Cost 3 vsldoi8 <3,6,7,0>, <3,6,7,0>
+  2718714268U, // <7,0,3,3>: Cost 3 vsldoi8 <5,6,7,0>, <3,3,3,3>
+  2718714370U, // <7,0,3,4>: Cost 3 vsldoi8 <5,6,7,0>, <3,4,5,6>
+  2718714461U, // <7,0,3,5>: Cost 3 vsldoi8 <5,6,7,0>, <3,5,6,7>
+  2706770608U, // <7,0,3,6>: Cost 3 vsldoi8 <3,6,7,0>, <3,6,7,0>
   3847160114U, // <7,0,3,7>: Cost 4 vsldoi12 <3,6,0,7>, <0,3,7,0>
-  3852910907U, // <7,0,3,u>: Cost 3 vsldoi12 RHS, <0,3,u,0>
-  3792456594U, // <7,0,4,0>: Cost 3 vsldoi8 <5,6,7,0>, <4,0,5,1>
-  2779169106U, // <7,0,4,1>: Cost 2 vsldoi12 RHS, <0,4,1,5>
+  2779169083U, // <7,0,3,u>: Cost 3 vsldoi12 RHS, <0,3,u,0>
+  2718714770U, // <7,0,4,0>: Cost 3 vsldoi8 <5,6,7,0>, <4,0,5,1>
+  1705427282U, // <7,0,4,1>: Cost 2 vsldoi12 RHS, <0,4,1,5>
   3713583034U, // <7,0,4,2>: Cost 4 vsldoi4 <3,7,0,4>, <2,6,3,7>
   3713583814U, // <7,0,4,3>: Cost 4 vsldoi4 <3,7,0,4>, <3,7,0,4>
-  3852910957U, // <7,0,4,4>: Cost 3 vsldoi12 RHS, <0,4,4,5>
-  2718715190U, // <7,0,4,5>: Cost 2 vsldoi8 <5,6,7,0>, RHS
-  3731501905U, // <7,0,4,6>: Cost 3 vsldoi4 <6,7,0,4>, <6,7,0,4>
-  3333210692U, // <7,0,4,7>: Cost 3 vmrghw <7,4,5,6>, <0,7,1,4>
-  2779169169U, // <7,0,4,u>: Cost 2 vsldoi12 RHS, <0,4,u,5>
-  3792457332U, // <7,0,5,0>: Cost 3 vsldoi8 <5,6,7,0>, <5,0,6,1>
-  3333865574U, // <7,0,5,1>: Cost 3 vmrghw <7,5,5,5>, LHS
+  2779169133U, // <7,0,4,4>: Cost 3 vsldoi12 RHS, <0,4,4,5>
+  1644973366U, // <7,0,4,5>: Cost 2 vsldoi8 <5,6,7,0>, RHS
+  2657760081U, // <7,0,4,6>: Cost 3 vsldoi4 <6,7,0,4>, <6,7,0,4>
+  2259468868U, // <7,0,4,7>: Cost 3 vmrghw <7,4,5,6>, <0,7,1,4>
+  1705427345U, // <7,0,4,u>: Cost 2 vsldoi12 RHS, <0,4,u,5>
+  2718715508U, // <7,0,5,0>: Cost 3 vsldoi8 <5,6,7,0>, <5,0,6,1>
+  2260123750U, // <7,0,5,1>: Cost 3 vmrghw <7,5,5,5>, LHS
   3792457451U, // <7,0,5,2>: Cost 4 vsldoi8 <5,6,7,0>, <5,2,1,3>
   3852911024U, // <7,0,5,3>: Cost 4 vsldoi12 RHS, <0,5,3,0>
-  3792457660U, // <7,0,5,4>: Cost 3 vsldoi8 <5,6,7,0>, <5,4,6,5>
-  3792457732U, // <7,0,5,5>: Cost 3 vsldoi8 <5,6,7,0>, <5,5,5,5>
-  2718716002U, // <7,0,5,6>: Cost 2 vsldoi8 <5,6,7,0>, <5,6,7,0>
+  2718715836U, // <7,0,5,4>: Cost 3 vsldoi8 <5,6,7,0>, <5,4,6,5>
+  2718715908U, // <7,0,5,5>: Cost 3 vsldoi8 <5,6,7,0>, <5,5,5,5>
+  1644974178U, // <7,0,5,6>: Cost 2 vsldoi8 <5,6,7,0>, <5,6,7,0>
   3792457853U, // <7,0,5,7>: Cost 4 vsldoi8 <5,6,7,0>, <5,7,1,0>
-  2720043268U, // <7,0,5,u>: Cost 2 vsldoi8 <5,u,7,0>, <5,u,7,0>
-  3794448725U, // <7,0,6,0>: Cost 3 vsldoi8 <6,0,7,0>, <6,0,7,0>
-  3852911094U, // <7,0,6,1>: Cost 3 vsldoi12 RHS, <0,6,1,7>
-  3792458234U, // <7,0,6,2>: Cost 3 vsldoi8 <5,6,7,0>, <6,2,7,3>
-  3796439624U, // <7,0,6,3>: Cost 3 vsldoi8 <6,3,7,0>, <6,3,7,0>
+  1646301444U, // <7,0,5,u>: Cost 2 vsldoi8 <5,u,7,0>, <5,u,7,0>
+  2720706901U, // <7,0,6,0>: Cost 3 vsldoi8 <6,0,7,0>, <6,0,7,0>
+  2779169270U, // <7,0,6,1>: Cost 3 vsldoi12 RHS, <0,6,1,7>
+  2718716410U, // <7,0,6,2>: Cost 3 vsldoi8 <5,6,7,0>, <6,2,7,3>
+  2722697800U, // <7,0,6,3>: Cost 3 vsldoi8 <6,3,7,0>, <6,3,7,0>
   3852911121U, // <7,0,6,4>: Cost 4 vsldoi12 RHS, <0,6,4,7>
   3852911130U, // <7,0,6,5>: Cost 4 vsldoi12 RHS, <0,6,5,7>
-  3792458552U, // <7,0,6,6>: Cost 3 vsldoi8 <5,6,7,0>, <6,6,6,6>
-  3792458574U, // <7,0,6,7>: Cost 3 vsldoi8 <5,6,7,0>, <6,7,0,1>
-  3852911157U, // <7,0,6,u>: Cost 3 vsldoi12 RHS, <0,6,u,7>
-  3792458746U, // <7,0,7,0>: Cost 3 vsldoi8 <5,6,7,0>, <7,0,1,2>
-  2261614694U, // <7,0,7,1>: Cost 2 vmrghw <7,7,7,7>, LHS
-  3792458900U, // <7,0,7,2>: Cost 3 vsldoi8 <5,6,7,0>, <7,2,0,3>
+  2718716728U, // <7,0,6,6>: Cost 3 vsldoi8 <5,6,7,0>, <6,6,6,6>
+  2718716750U, // <7,0,6,7>: Cost 3 vsldoi8 <5,6,7,0>, <6,7,0,1>
+  2779169333U, // <7,0,6,u>: Cost 3 vsldoi12 RHS, <0,6,u,7>
+  2718716922U, // <7,0,7,0>: Cost 3 vsldoi8 <5,6,7,0>, <7,0,1,2>
+  1187872870U, // <7,0,7,1>: Cost 2 vmrghw <7,7,7,7>, LHS
+  2718717076U, // <7,0,7,2>: Cost 3 vsldoi8 <5,6,7,0>, <7,2,0,3>
   3847160408U, // <7,0,7,3>: Cost 4 vsldoi12 <3,6,0,7>, <0,7,3,6>
-  3792459110U, // <7,0,7,4>: Cost 3 vsldoi8 <5,6,7,0>, <7,4,5,6>
-  3792459201U, // <7,0,7,5>: Cost 3 vsldoi8 <5,6,7,0>, <7,5,6,7>
-  3792459228U, // <7,0,7,6>: Cost 3 vsldoi8 <5,6,7,0>, <7,6,0,7>
-  3792459302U, // <7,0,7,7>: Cost 3 vsldoi8 <5,6,7,0>, <7,7,0,0>
-  2261615261U, // <7,0,7,u>: Cost 2 vmrghw <7,7,7,7>, LHS
-  2657788006U, // <7,0,u,0>: Cost 2 vsldoi4 <6,7,0,u>, LHS
-  2779169426U, // <7,0,u,1>: Cost 2 vsldoi12 RHS, <0,u,1,1>
-  1705427613U, // <7,0,u,2>: Cost 1 vsldoi12 RHS, LHS
-  3713616586U, // <7,0,u,3>: Cost 3 vsldoi4 <3,7,0,u>, <3,7,0,u>
-  2657791286U, // <7,0,u,4>: Cost 2 vsldoi4 <6,7,0,u>, RHS
-  2718718106U, // <7,0,u,5>: Cost 2 vsldoi8 <5,6,7,0>, RHS
-  2657792853U, // <7,0,u,6>: Cost 2 vsldoi4 <6,7,0,u>, <6,7,0,u>
-  3792460032U, // <7,0,u,7>: Cost 3 vsldoi8 <5,6,7,0>, <u,7,0,1>
-  1705427667U, // <7,0,u,u>: Cost 1 vsldoi12 RHS, LHS
-  3795116042U, // <7,1,0,0>: Cost 3 vsldoi8 <6,1,7,1>, <0,0,1,1>
-  3852911331U, // <7,1,0,1>: Cost 3 vsldoi12 RHS, <1,0,1,1>
-  3852911340U, // <7,1,0,2>: Cost 3 vsldoi12 RHS, <1,0,2,1>
+  2718717286U, // <7,0,7,4>: Cost 3 vsldoi8 <5,6,7,0>, <7,4,5,6>
+  2718717377U, // <7,0,7,5>: Cost 3 vsldoi8 <5,6,7,0>, <7,5,6,7>
+  2718717404U, // <7,0,7,6>: Cost 3 vsldoi8 <5,6,7,0>, <7,6,0,7>
+  2718717478U, // <7,0,7,7>: Cost 3 vsldoi8 <5,6,7,0>, <7,7,0,0>
+  1187873437U, // <7,0,7,u>: Cost 2 vmrghw <7,7,7,7>, LHS
+  1584046182U, // <7,0,u,0>: Cost 2 vsldoi4 <6,7,0,u>, LHS
+  1705427602U, // <7,0,u,1>: Cost 2 vsldoi12 RHS, <0,u,1,1>
+  631685789U,  // <7,0,u,2>: Cost 1 vsldoi12 RHS, LHS
+  2639874762U, // <7,0,u,3>: Cost 3 vsldoi4 <3,7,0,u>, <3,7,0,u>
+  1584049462U, // <7,0,u,4>: Cost 2 vsldoi4 <6,7,0,u>, RHS
+  1644976282U, // <7,0,u,5>: Cost 2 vsldoi8 <5,6,7,0>, RHS
+  1584051029U, // <7,0,u,6>: Cost 2 vsldoi4 <6,7,0,u>, <6,7,0,u>
+  2718718208U, // <7,0,u,7>: Cost 3 vsldoi8 <5,6,7,0>, <u,7,0,1>
+  631685843U,  // <7,0,u,u>: Cost 1 vsldoi12 RHS, LHS
+  2721374218U, // <7,1,0,0>: Cost 3 vsldoi8 <6,1,7,1>, <0,0,1,1>
+  2779169507U, // <7,1,0,1>: Cost 3 vsldoi12 RHS, <1,0,1,1>
+  2779169516U, // <7,1,0,2>: Cost 3 vsldoi12 RHS, <1,0,2,1>
   3852911348U, // <7,1,0,3>: Cost 4 vsldoi12 RHS, <1,0,3,0>
-  3743485238U, // <7,1,0,4>: Cost 3 vsldoi4 <u,7,1,0>, RHS
-  3389800786U, // <7,1,0,5>: Cost 3 vmrglw <5,6,7,0>, <0,4,1,5>
-  3389800868U, // <7,1,0,6>: Cost 3 vmrglw <5,6,7,0>, <0,5,1,6>
-  3743486970U, // <7,1,0,7>: Cost 3 vsldoi4 <u,7,1,0>, <7,0,1,2>
-  3852911394U, // <7,1,0,u>: Cost 3 vsldoi12 RHS, <1,0,u,1>
-  3852911403U, // <7,1,1,0>: Cost 3 vsldoi12 RHS, <1,1,0,1>
-  2779169588U, // <7,1,1,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
-  3852911422U, // <7,1,1,2>: Cost 3 vsldoi12 RHS, <1,1,2,2>
+  2669743414U, // <7,1,0,4>: Cost 3 vsldoi4 <u,7,1,0>, RHS
+  2316058962U, // <7,1,0,5>: Cost 3 vmrglw <5,6,7,0>, <0,4,1,5>
+  2316059044U, // <7,1,0,6>: Cost 3 vmrglw <5,6,7,0>, <0,5,1,6>
+  2669745146U, // <7,1,0,7>: Cost 3 vsldoi4 <u,7,1,0>, <7,0,1,2>
+  2779169570U, // <7,1,0,u>: Cost 3 vsldoi12 RHS, <1,0,u,1>
+  2779169579U, // <7,1,1,0>: Cost 3 vsldoi12 RHS, <1,1,0,1>
+  1705427764U, // <7,1,1,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
+  2779169598U, // <7,1,1,2>: Cost 3 vsldoi12 RHS, <1,1,2,2>
   3713632972U, // <7,1,1,3>: Cost 4 vsldoi4 <3,7,1,1>, <3,7,1,1>
-  3852911443U, // <7,1,1,4>: Cost 3 vsldoi12 RHS, <1,1,4,5>
-  3852911452U, // <7,1,1,5>: Cost 3 vsldoi12 RHS, <1,1,5,5>
-  3731551063U, // <7,1,1,6>: Cost 3 vsldoi4 <6,7,1,1>, <6,7,1,1>
+  2779169619U, // <7,1,1,4>: Cost 3 vsldoi12 RHS, <1,1,4,5>
+  2779169628U, // <7,1,1,5>: Cost 3 vsldoi12 RHS, <1,1,5,5>
+  2657809239U, // <7,1,1,6>: Cost 3 vsldoi4 <6,7,1,1>, <6,7,1,1>
   3835290474U, // <7,1,1,7>: Cost 4 vsldoi12 <1,6,1,7>, <1,1,7,1>
-  2779169588U, // <7,1,1,u>: Cost 2 vsldoi12 RHS, <1,1,1,1>
-  3852911484U, // <7,1,2,0>: Cost 3 vsldoi12 RHS, <1,2,0,1>
-  3852911495U, // <7,1,2,1>: Cost 3 vsldoi12 RHS, <1,2,1,3>
-  3852911504U, // <7,1,2,2>: Cost 3 vsldoi12 RHS, <1,2,2,3>
-  2779169686U, // <7,1,2,3>: Cost 2 vsldoi12 RHS, <1,2,3,0>
-  3852911524U, // <7,1,2,4>: Cost 3 vsldoi12 RHS, <1,2,4,5>
-  3852911531U, // <7,1,2,5>: Cost 3 vsldoi12 RHS, <1,2,5,3>
-  3731559256U, // <7,1,2,6>: Cost 3 vsldoi4 <6,7,1,2>, <6,7,1,2>
-  3876799418U, // <7,1,2,7>: Cost 3 vsldoi12 RHS, <1,2,7,0>
-  2779169731U, // <7,1,2,u>: Cost 2 vsldoi12 RHS, <1,2,u,0>
+  1705427764U, // <7,1,1,u>: Cost 2 vsldoi12 RHS, <1,1,1,1>
+  2779169660U, // <7,1,2,0>: Cost 3 vsldoi12 RHS, <1,2,0,1>
+  2779169671U, // <7,1,2,1>: Cost 3 vsldoi12 RHS, <1,2,1,3>
+  2779169680U, // <7,1,2,2>: Cost 3 vsldoi12 RHS, <1,2,2,3>
+  1705427862U, // <7,1,2,3>: Cost 2 vsldoi12 RHS, <1,2,3,0>
+  2779169700U, // <7,1,2,4>: Cost 3 vsldoi12 RHS, <1,2,4,5>
+  2779169707U, // <7,1,2,5>: Cost 3 vsldoi12 RHS, <1,2,5,3>
+  2657817432U, // <7,1,2,6>: Cost 3 vsldoi4 <6,7,1,2>, <6,7,1,2>
+  2803057594U, // <7,1,2,7>: Cost 3 vsldoi12 RHS, <1,2,7,0>
+  1705427907U, // <7,1,2,u>: Cost 2 vsldoi12 RHS, <1,2,u,0>
   3776538827U, // <7,1,3,0>: Cost 4 vsldoi8 <3,0,7,1>, <3,0,7,1>
-  3393142794U, // <7,1,3,1>: Cost 3 vmrglw <6,2,7,3>, <0,0,1,1>
-  3389827222U, // <7,1,3,2>: Cost 3 vmrglw <5,6,7,3>, <3,0,1,2>
+  2319400970U, // <7,1,3,1>: Cost 3 vmrglw <6,2,7,3>, <0,0,1,1>
+  2316085398U, // <7,1,3,2>: Cost 3 vmrglw <5,6,7,3>, <3,0,1,2>
   3852911591U, // <7,1,3,3>: Cost 4 vsldoi12 RHS, <1,3,3,0>
   3852911600U, // <7,1,3,4>: Cost 4 vsldoi12 RHS, <1,3,4,0>
-  3393143122U, // <7,1,3,5>: Cost 3 vmrglw <6,2,7,3>, <0,4,1,5>
+  2319401298U, // <7,1,3,5>: Cost 3 vmrglw <6,2,7,3>, <0,4,1,5>
   3833668617U, // <7,1,3,6>: Cost 4 vsldoi12 <1,3,6,7>, <1,3,6,7>
   3367265487U, // <7,1,3,7>: Cost 4 vmrglw <1,u,7,3>, <1,6,1,7>
-  3393142801U, // <7,1,3,u>: Cost 3 vmrglw <6,2,7,3>, <0,0,1,u>
-  3797773202U, // <7,1,4,0>: Cost 3 vsldoi8 <6,5,7,1>, <4,0,5,1>
-  3852911659U, // <7,1,4,1>: Cost 3 vsldoi12 RHS, <1,4,1,5>
-  3852911668U, // <7,1,4,2>: Cost 3 vsldoi12 RHS, <1,4,2,5>
+  2319400977U, // <7,1,3,u>: Cost 3 vmrglw <6,2,7,3>, <0,0,1,u>
+  2724031378U, // <7,1,4,0>: Cost 3 vsldoi8 <6,5,7,1>, <4,0,5,1>
+  2779169835U, // <7,1,4,1>: Cost 3 vsldoi12 RHS, <1,4,1,5>
+  2779169844U, // <7,1,4,2>: Cost 3 vsldoi12 RHS, <1,4,2,5>
   3852911672U, // <7,1,4,3>: Cost 4 vsldoi12 RHS, <1,4,3,0>
-  3743518006U, // <7,1,4,4>: Cost 3 vsldoi4 <u,7,1,4>, RHS
-  3852911696U, // <7,1,4,5>: Cost 3 vsldoi12 RHS, <1,4,5,6>
+  2669776182U, // <7,1,4,4>: Cost 3 vsldoi4 <u,7,1,4>, RHS
+  2779169872U, // <7,1,4,5>: Cost 3 vsldoi12 RHS, <1,4,5,6>
   3835290712U, // <7,1,4,6>: Cost 4 vsldoi12 <1,6,1,7>, <1,4,6,5>
-  3743520102U, // <7,1,4,7>: Cost 3 vsldoi4 <u,7,1,4>, <7,4,5,6>
-  3852911722U, // <7,1,4,u>: Cost 3 vsldoi12 RHS, <1,4,u,5>
-  3852911727U, // <7,1,5,0>: Cost 3 vsldoi12 RHS, <1,5,0,1>
+  2669778278U, // <7,1,4,7>: Cost 3 vsldoi4 <u,7,1,4>, <7,4,5,6>
+  2779169898U, // <7,1,4,u>: Cost 3 vsldoi12 RHS, <1,4,u,5>
+  2779169903U, // <7,1,5,0>: Cost 3 vsldoi12 RHS, <1,5,0,1>
   3835585661U, // <7,1,5,1>: Cost 4 vsldoi12 <1,6,5,7>, <1,5,1,6>
   3841410182U, // <7,1,5,2>: Cost 4 vsldoi12 <2,6,3,7>, <1,5,2,6>
   3852911753U, // <7,1,5,3>: Cost 4 vsldoi12 RHS, <1,5,3,0>
-  3852911767U, // <7,1,5,4>: Cost 3 vsldoi12 RHS, <1,5,4,5>
-  3392495954U, // <7,1,5,5>: Cost 3 vmrglw <6,1,7,5>, <0,4,1,5>
-  3792466019U, // <7,1,5,6>: Cost 3 vsldoi8 <5,6,7,1>, <5,6,7,1>
+  2779169943U, // <7,1,5,4>: Cost 3 vsldoi12 RHS, <1,5,4,5>
+  2318754130U, // <7,1,5,5>: Cost 3 vmrglw <6,1,7,5>, <0,4,1,5>
+  2718724195U, // <7,1,5,6>: Cost 3 vsldoi8 <5,6,7,1>, <5,6,7,1>
   3859178670U, // <7,1,5,7>: Cost 4 vsldoi12 <5,6,1,7>, <1,5,7,1>
-  3852911799U, // <7,1,5,u>: Cost 3 vsldoi12 RHS, <1,5,u,1>
-  3794456918U, // <7,1,6,0>: Cost 3 vsldoi8 <6,0,7,1>, <6,0,7,1>
-  3835290831U, // <7,1,6,1>: Cost 3 vsldoi12 <1,6,1,7>, <1,6,1,7>
-  3852911832U, // <7,1,6,2>: Cost 3 vsldoi12 RHS, <1,6,2,7>
+  2779169975U, // <7,1,5,u>: Cost 3 vsldoi12 RHS, <1,5,u,1>
+  2720715094U, // <7,1,6,0>: Cost 3 vsldoi8 <6,0,7,1>, <6,0,7,1>
+  2761549007U, // <7,1,6,1>: Cost 3 vsldoi12 <1,6,1,7>, <1,6,1,7>
+  2779170008U, // <7,1,6,2>: Cost 3 vsldoi12 RHS, <1,6,2,7>
   3835438305U, // <7,1,6,3>: Cost 4 vsldoi12 <1,6,3,7>, <1,6,3,7>
   3835512042U, // <7,1,6,4>: Cost 4 vsldoi12 <1,6,4,7>, <1,6,4,7>
-  3835585779U, // <7,1,6,5>: Cost 3 vsldoi12 <1,6,5,7>, <1,6,5,7>
+  2761843955U, // <7,1,6,5>: Cost 3 vsldoi12 <1,6,5,7>, <1,6,5,7>
   3835659516U, // <7,1,6,6>: Cost 4 vsldoi12 <1,6,6,7>, <1,6,6,7>
-  3876799742U, // <7,1,6,7>: Cost 3 vsldoi12 RHS, <1,6,7,0>
-  3835806990U, // <7,1,6,u>: Cost 3 vsldoi12 <1,6,u,7>, <1,6,u,7>
-  3743539302U, // <7,1,7,0>: Cost 3 vsldoi4 <u,7,1,7>, LHS
-  3395829770U, // <7,1,7,1>: Cost 3 vmrglw <6,6,7,7>, <0,0,1,1>
-  3391190010U, // <7,1,7,2>: Cost 3 vmrglw <5,u,7,7>, <7,0,1,2>
+  2803057918U, // <7,1,6,7>: Cost 3 vsldoi12 RHS, <1,6,7,0>
+  2762065166U, // <7,1,6,u>: Cost 3 vsldoi12 <1,6,u,7>, <1,6,u,7>
+  2669797478U, // <7,1,7,0>: Cost 3 vsldoi4 <u,7,1,7>, LHS
+  2322087946U, // <7,1,7,1>: Cost 3 vmrglw <6,6,7,7>, <0,0,1,1>
+  2317448186U, // <7,1,7,2>: Cost 3 vmrglw <5,u,7,7>, <7,0,1,2>
   3395829934U, // <7,1,7,3>: Cost 4 vmrglw <6,6,7,7>, <0,2,1,3>
-  3743542582U, // <7,1,7,4>: Cost 3 vsldoi4 <u,7,1,7>, RHS
-  3395830098U, // <7,1,7,5>: Cost 3 vmrglw <6,6,7,7>, <0,4,1,5>
+  2669800758U, // <7,1,7,4>: Cost 3 vsldoi4 <u,7,1,7>, RHS
+  2322088274U, // <7,1,7,5>: Cost 3 vmrglw <6,6,7,7>, <0,4,1,5>
   3375923377U, // <7,1,7,6>: Cost 4 vmrglw <3,3,7,7>, <0,2,1,6>
-  3805738604U, // <7,1,7,7>: Cost 3 vsldoi8 <7,u,7,1>, <7,7,7,7>
-  3395829777U, // <7,1,7,u>: Cost 3 vmrglw <6,6,7,7>, <0,0,1,u>
-  3852911970U, // <7,1,u,0>: Cost 3 vsldoi12 RHS, <1,u,0,1>
-  2779169588U, // <7,1,u,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
-  3852911988U, // <7,1,u,2>: Cost 3 vsldoi12 RHS, <1,u,2,1>
-  2779170172U, // <7,1,u,3>: Cost 2 vsldoi12 RHS, <1,u,3,0>
-  3852912010U, // <7,1,u,4>: Cost 3 vsldoi12 RHS, <1,u,4,5>
-  3836913045U, // <7,1,u,5>: Cost 3 vsldoi12 <1,u,5,7>, <1,u,5,7>
-  3731608414U, // <7,1,u,6>: Cost 3 vsldoi4 <6,7,1,u>, <6,7,1,u>
-  3876799904U, // <7,1,u,7>: Cost 3 vsldoi12 RHS, <1,u,7,0>
-  2779170217U, // <7,1,u,u>: Cost 2 vsldoi12 RHS, <1,u,u,0>
+  2731996780U, // <7,1,7,7>: Cost 3 vsldoi8 <7,u,7,1>, <7,7,7,7>
+  2322087953U, // <7,1,7,u>: Cost 3 vmrglw <6,6,7,7>, <0,0,1,u>
+  2779170146U, // <7,1,u,0>: Cost 3 vsldoi12 RHS, <1,u,0,1>
+  1705427764U, // <7,1,u,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
+  2779170164U, // <7,1,u,2>: Cost 3 vsldoi12 RHS, <1,u,2,1>
+  1705428348U, // <7,1,u,3>: Cost 2 vsldoi12 RHS, <1,u,3,0>
+  2779170186U, // <7,1,u,4>: Cost 3 vsldoi12 RHS, <1,u,4,5>
+  2763171221U, // <7,1,u,5>: Cost 3 vsldoi12 <1,u,5,7>, <1,u,5,7>
+  2657866590U, // <7,1,u,6>: Cost 3 vsldoi4 <6,7,1,u>, <6,7,1,u>
+  2803058080U, // <7,1,u,7>: Cost 3 vsldoi12 RHS, <1,u,7,0>
+  1705428393U, // <7,1,u,u>: Cost 2 vsldoi12 RHS, <1,u,u,0>
   3713695846U, // <7,2,0,0>: Cost 4 vsldoi4 <3,7,2,0>, LHS
-  3852912061U, // <7,2,0,1>: Cost 3 vsldoi12 RHS, <2,0,1,2>
-  3852912069U, // <7,2,0,2>: Cost 3 vsldoi12 RHS, <2,0,2,1>
-  2316058726U, // <7,2,0,3>: Cost 2 vmrglw <5,6,7,0>, LHS
+  2779170237U, // <7,2,0,1>: Cost 3 vsldoi12 RHS, <2,0,1,2>
+  2779170245U, // <7,2,0,2>: Cost 3 vsldoi12 RHS, <2,0,2,1>
+  1242316902U, // <7,2,0,3>: Cost 2 vmrglw <5,6,7,0>, LHS
   3713699126U, // <7,2,0,4>: Cost 4 vsldoi4 <3,7,2,0>, RHS
   3852912096U, // <7,2,0,5>: Cost 4 vsldoi12 RHS, <2,0,5,1>
-  3841410537U, // <7,2,0,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,0,6,1>
-  3330230250U, // <7,2,0,7>: Cost 3 vmrghw <7,0,1,2>, <2,7,0,1>
-  2316058731U, // <7,2,0,u>: Cost 2 vmrglw <5,6,7,0>, LHS
+  2767668713U, // <7,2,0,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,0,6,1>
+  2256488426U, // <7,2,0,7>: Cost 3 vmrghw <7,0,1,2>, <2,7,0,1>
+  1242316907U, // <7,2,0,u>: Cost 2 vmrglw <5,6,7,0>, LHS
   3852912132U, // <7,2,1,0>: Cost 4 vsldoi12 RHS, <2,1,0,1>
   3852912141U, // <7,2,1,1>: Cost 4 vsldoi12 RHS, <2,1,1,1>
   3852912149U, // <7,2,1,2>: Cost 4 vsldoi12 RHS, <2,1,2,0>
-  3852912159U, // <7,2,1,3>: Cost 3 vsldoi12 RHS, <2,1,3,1>
+  2779170335U, // <7,2,1,3>: Cost 3 vsldoi12 RHS, <2,1,3,1>
   3852912172U, // <7,2,1,4>: Cost 4 vsldoi12 RHS, <2,1,4,5>
   3840747062U, // <7,2,1,5>: Cost 5 vsldoi12 <2,5,3,7>, <2,1,5,6>
   3841410617U, // <7,2,1,6>: Cost 4 vsldoi12 <2,6,3,7>, <2,1,6,0>
   3795125538U, // <7,2,1,7>: Cost 4 vsldoi8 <6,1,7,2>, <1,7,2,0>
-  3852912204U, // <7,2,1,u>: Cost 3 vsldoi12 RHS, <2,1,u,1>
-  3852912213U, // <7,2,2,0>: Cost 3 vsldoi12 RHS, <2,2,0,1>
+  2779170380U, // <7,2,1,u>: Cost 3 vsldoi12 RHS, <2,1,u,1>
+  2779170389U, // <7,2,2,0>: Cost 3 vsldoi12 RHS, <2,2,0,1>
   3852912222U, // <7,2,2,1>: Cost 4 vsldoi12 RHS, <2,2,1,1>
-  2779170408U, // <7,2,2,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
-  2779170418U, // <7,2,2,3>: Cost 2 vsldoi12 RHS, <2,2,3,3>
-  3852912253U, // <7,2,2,4>: Cost 3 vsldoi12 RHS, <2,2,4,5>
+  1705428584U, // <7,2,2,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
+  1705428594U, // <7,2,2,3>: Cost 2 vsldoi12 RHS, <2,2,3,3>
+  2779170429U, // <7,2,2,4>: Cost 3 vsldoi12 RHS, <2,2,4,5>
   3852912259U, // <7,2,2,5>: Cost 4 vsldoi12 RHS, <2,2,5,2>
-  3841410704U, // <7,2,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,2,6,6>
+  2767668880U, // <7,2,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,2,6,6>
   3841336981U, // <7,2,2,7>: Cost 4 vsldoi12 <2,6,2,7>, <2,2,7,2>
-  2779170463U, // <7,2,2,u>: Cost 2 vsldoi12 RHS, <2,2,u,3>
-  2779170470U, // <7,2,3,0>: Cost 2 vsldoi12 RHS, <2,3,0,1>
-  3852912303U, // <7,2,3,1>: Cost 3 vsldoi12 RHS, <2,3,1,1>
-  3841410749U, // <7,2,3,2>: Cost 3 vsldoi12 <2,6,3,7>, <2,3,2,6>
-  2319401062U, // <7,2,3,3>: Cost 2 vmrglw <6,2,7,3>, LHS
-  2779170510U, // <7,2,3,4>: Cost 2 vsldoi12 RHS, <2,3,4,5>
-  3852912343U, // <7,2,3,5>: Cost 3 vsldoi12 RHS, <2,3,5,5>
-  3731641186U, // <7,2,3,6>: Cost 3 vsldoi4 <6,7,2,3>, <6,7,2,3>
-  3393148398U, // <7,2,3,7>: Cost 3 vmrglw <6,2,7,3>, <7,6,2,7>
-  2779170542U, // <7,2,3,u>: Cost 2 vsldoi12 RHS, <2,3,u,1>
+  1705428639U, // <7,2,2,u>: Cost 2 vsldoi12 RHS, <2,2,u,3>
+  1705428646U, // <7,2,3,0>: Cost 2 vsldoi12 RHS, <2,3,0,1>
+  2779170479U, // <7,2,3,1>: Cost 3 vsldoi12 RHS, <2,3,1,1>
+  2767668925U, // <7,2,3,2>: Cost 3 vsldoi12 <2,6,3,7>, <2,3,2,6>
+  1245659238U, // <7,2,3,3>: Cost 2 vmrglw <6,2,7,3>, LHS
+  1705428686U, // <7,2,3,4>: Cost 2 vsldoi12 RHS, <2,3,4,5>
+  2779170519U, // <7,2,3,5>: Cost 3 vsldoi12 RHS, <2,3,5,5>
+  2657899362U, // <7,2,3,6>: Cost 3 vsldoi4 <6,7,2,3>, <6,7,2,3>
+  2319406574U, // <7,2,3,7>: Cost 3 vmrglw <6,2,7,3>, <7,6,2,7>
+  1705428718U, // <7,2,3,u>: Cost 2 vsldoi12 RHS, <2,3,u,1>
   3713728614U, // <7,2,4,0>: Cost 4 vsldoi4 <3,7,2,4>, LHS
   3852912388U, // <7,2,4,1>: Cost 4 vsldoi12 RHS, <2,4,1,5>
-  3852912397U, // <7,2,4,2>: Cost 3 vsldoi12 RHS, <2,4,2,5>
-  2316091494U, // <7,2,4,3>: Cost 2 vmrglw <5,6,7,4>, LHS
+  2779170573U, // <7,2,4,2>: Cost 3 vsldoi12 RHS, <2,4,2,5>
+  1242349670U, // <7,2,4,3>: Cost 2 vmrglw <5,6,7,4>, LHS
   3713731894U, // <7,2,4,4>: Cost 4 vsldoi4 <3,7,2,4>, RHS
-  3852912425U, // <7,2,4,5>: Cost 3 vsldoi12 RHS, <2,4,5,6>
-  3841410865U, // <7,2,4,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,4,6,5>
+  2779170601U, // <7,2,4,5>: Cost 3 vsldoi12 RHS, <2,4,5,6>
+  2767669041U, // <7,2,4,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,4,6,5>
   3389834456U, // <7,2,4,7>: Cost 4 vmrglw <5,6,7,4>, <1,6,2,7>
-  2316091499U, // <7,2,4,u>: Cost 2 vmrglw <5,6,7,4>, LHS
+  1242349675U, // <7,2,4,u>: Cost 2 vmrglw <5,6,7,4>, LHS
   3852912456U, // <7,2,5,0>: Cost 4 vsldoi12 RHS, <2,5,0,1>
   3852912466U, // <7,2,5,1>: Cost 4 vsldoi12 RHS, <2,5,1,2>
   3852912475U, // <7,2,5,2>: Cost 4 vsldoi12 RHS, <2,5,2,2>
-  3852912488U, // <7,2,5,3>: Cost 3 vsldoi12 RHS, <2,5,3,6>
+  2779170664U, // <7,2,5,3>: Cost 3 vsldoi12 RHS, <2,5,3,6>
   3852912496U, // <7,2,5,4>: Cost 4 vsldoi12 RHS, <2,5,4,5>
   3792474116U, // <7,2,5,5>: Cost 4 vsldoi8 <5,6,7,2>, <5,5,5,5>
-  3792474212U, // <7,2,5,6>: Cost 3 vsldoi8 <5,6,7,2>, <5,6,7,2>
+  2718732388U, // <7,2,5,6>: Cost 3 vsldoi8 <5,6,7,2>, <5,6,7,2>
   3841337228U, // <7,2,5,7>: Cost 5 vsldoi12 <2,6,2,7>, <2,5,7,6>
-  3852912533U, // <7,2,5,u>: Cost 3 vsldoi12 RHS, <2,5,u,6>
-  3713744998U, // <7,2,6,0>: Cost 3 vsldoi4 <3,7,2,6>, LHS
-  3795128744U, // <7,2,6,1>: Cost 3 vsldoi8 <6,1,7,2>, <6,1,7,2>
-  3841337265U, // <7,2,6,2>: Cost 3 vsldoi12 <2,6,2,7>, <2,6,2,7>
-  2767669178U, // <7,2,6,3>: Cost 2 vsldoi12 <2,6,3,7>, <2,6,3,7>
-  3713748278U, // <7,2,6,4>: Cost 3 vsldoi4 <3,7,2,6>, RHS
+  2779170709U, // <7,2,5,u>: Cost 3 vsldoi12 RHS, <2,5,u,6>
+  2640003174U, // <7,2,6,0>: Cost 3 vsldoi4 <3,7,2,6>, LHS
+  2721386920U, // <7,2,6,1>: Cost 3 vsldoi8 <6,1,7,2>, <6,1,7,2>
+  2767595441U, // <7,2,6,2>: Cost 3 vsldoi12 <2,6,2,7>, <2,6,2,7>
+  1693927354U, // <7,2,6,3>: Cost 2 vsldoi12 <2,6,3,7>, <2,6,3,7>
+  2640006454U, // <7,2,6,4>: Cost 3 vsldoi4 <3,7,2,6>, RHS
   3841558476U, // <7,2,6,5>: Cost 4 vsldoi12 <2,6,5,7>, <2,6,5,7>
-  3731665765U, // <7,2,6,6>: Cost 3 vsldoi4 <6,7,2,6>, <6,7,2,6>
+  2657923941U, // <7,2,6,6>: Cost 3 vsldoi4 <6,7,2,6>, <6,7,2,6>
   3841337310U, // <7,2,6,7>: Cost 4 vsldoi12 <2,6,2,7>, <2,6,7,7>
-  2768037863U, // <7,2,6,u>: Cost 2 vsldoi12 <2,6,u,7>, <2,6,u,7>
-  3876800490U, // <7,2,7,0>: Cost 3 vsldoi12 RHS, <2,7,0,1>
+  1694296039U, // <7,2,6,u>: Cost 2 vsldoi12 <2,6,u,7>, <2,6,u,7>
+  2803058666U, // <7,2,7,0>: Cost 3 vsldoi12 RHS, <2,7,0,1>
   3852912632U, // <7,2,7,1>: Cost 4 vsldoi12 RHS, <2,7,1,6>
-  3395831400U, // <7,2,7,2>: Cost 3 vmrglw <6,6,7,7>, <2,2,2,2>
-  2322088038U, // <7,2,7,3>: Cost 2 vmrglw <6,6,7,7>, LHS
+  2322089576U, // <7,2,7,2>: Cost 3 vmrglw <6,6,7,7>, <2,2,2,2>
+  1248346214U, // <7,2,7,3>: Cost 2 vmrglw <6,6,7,7>, LHS
   3841337362U, // <7,2,7,4>: Cost 4 vsldoi12 <2,6,2,7>, <2,7,4,5>
   3395830836U, // <7,2,7,5>: Cost 4 vmrglw <6,6,7,7>, <1,4,2,5>
-  3335358394U, // <7,2,7,6>: Cost 3 vmrghw <7,7,7,7>, <2,6,3,7>
+  2261616570U, // <7,2,7,6>: Cost 3 vmrghw <7,7,7,7>, <2,6,3,7>
   3371943857U, // <7,2,7,7>: Cost 4 vmrglw <2,6,7,7>, <2,6,2,7>
-  2322088043U, // <7,2,7,u>: Cost 2 vmrglw <6,6,7,7>, LHS
-  2779170875U, // <7,2,u,0>: Cost 2 vsldoi12 RHS, <2,u,0,1>
-  3852912708U, // <7,2,u,1>: Cost 3 vsldoi12 RHS, <2,u,1,1>
-  2779170408U, // <7,2,u,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
-  2768996444U, // <7,2,u,3>: Cost 2 vsldoi12 <2,u,3,7>, <2,u,3,7>
-  2779170915U, // <7,2,u,4>: Cost 2 vsldoi12 RHS, <2,u,4,5>
-  3852912748U, // <7,2,u,5>: Cost 3 vsldoi12 RHS, <2,u,5,5>
-  3841411185U, // <7,2,u,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,u,6,1>
-  3876800633U, // <7,2,u,7>: Cost 3 vsldoi12 RHS, <2,u,7,0>
-  2769365129U, // <7,2,u,u>: Cost 2 vsldoi12 <2,u,u,7>, <2,u,u,7>
-  3852912779U, // <7,3,0,0>: Cost 3 vsldoi12 RHS, <3,0,0,0>
-  2779170966U, // <7,3,0,1>: Cost 2 vsldoi12 RHS, <3,0,1,2>
-  3707799556U, // <7,3,0,2>: Cost 3 vsldoi4 <2,7,3,0>, <2,7,3,0>
-  3852912807U, // <7,3,0,3>: Cost 3 vsldoi12 RHS, <3,0,3,1>
-  3852912816U, // <7,3,0,4>: Cost 3 vsldoi12 RHS, <3,0,4,1>
+  1248346219U, // <7,2,7,u>: Cost 2 vmrglw <6,6,7,7>, LHS
+  1705429051U, // <7,2,u,0>: Cost 2 vsldoi12 RHS, <2,u,0,1>
+  2779170884U, // <7,2,u,1>: Cost 3 vsldoi12 RHS, <2,u,1,1>
+  1705428584U, // <7,2,u,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
+  1695254620U, // <7,2,u,3>: Cost 2 vsldoi12 <2,u,3,7>, <2,u,3,7>
+  1705429091U, // <7,2,u,4>: Cost 2 vsldoi12 RHS, <2,u,4,5>
+  2779170924U, // <7,2,u,5>: Cost 3 vsldoi12 RHS, <2,u,5,5>
+  2767669361U, // <7,2,u,6>: Cost 3 vsldoi12 <2,6,3,7>, <2,u,6,1>
+  2803058809U, // <7,2,u,7>: Cost 3 vsldoi12 RHS, <2,u,7,0>
+  1695623305U, // <7,2,u,u>: Cost 2 vsldoi12 <2,u,u,7>, <2,u,u,7>
+  2779170955U, // <7,3,0,0>: Cost 3 vsldoi12 RHS, <3,0,0,0>
+  1705429142U, // <7,3,0,1>: Cost 2 vsldoi12 RHS, <3,0,1,2>
+  2634057732U, // <7,3,0,2>: Cost 3 vsldoi4 <2,7,3,0>, <2,7,3,0>
+  2779170983U, // <7,3,0,3>: Cost 3 vsldoi12 RHS, <3,0,3,1>
+  2779170992U, // <7,3,0,4>: Cost 3 vsldoi12 RHS, <3,0,4,1>
   3852912829U, // <7,3,0,5>: Cost 4 vsldoi12 RHS, <3,0,5,5>
-  3731690344U, // <7,3,0,6>: Cost 3 vsldoi4 <6,7,3,0>, <6,7,3,0>
-  3389802426U, // <7,3,0,7>: Cost 3 vmrglw <5,6,7,0>, <2,6,3,7>
-  2779171029U, // <7,3,0,u>: Cost 2 vsldoi12 RHS, <3,0,u,2>
+  2657948520U, // <7,3,0,6>: Cost 3 vsldoi4 <6,7,3,0>, <6,7,3,0>
+  2316060602U, // <7,3,0,7>: Cost 3 vmrglw <5,6,7,0>, <2,6,3,7>
+  1705429205U, // <7,3,0,u>: Cost 2 vsldoi12 RHS, <3,0,u,2>
   3852912860U, // <7,3,1,0>: Cost 4 vsldoi12 RHS, <3,1,0,0>
-  3852912870U, // <7,3,1,1>: Cost 3 vsldoi12 RHS, <3,1,1,1>
-  3852912881U, // <7,3,1,2>: Cost 3 vsldoi12 RHS, <3,1,2,3>
+  2779171046U, // <7,3,1,1>: Cost 3 vsldoi12 RHS, <3,1,1,1>
+  2779171057U, // <7,3,1,2>: Cost 3 vsldoi12 RHS, <3,1,2,3>
   3852912887U, // <7,3,1,3>: Cost 4 vsldoi12 RHS, <3,1,3,0>
   3852912896U, // <7,3,1,4>: Cost 4 vsldoi12 RHS, <3,1,4,0>
   3852912905U, // <7,3,1,5>: Cost 4 vsldoi12 RHS, <3,1,5,0>
   3835291923U, // <7,3,1,6>: Cost 4 vsldoi12 <1,6,1,7>, <3,1,6,1>
   3841411356U, // <7,3,1,7>: Cost 4 vsldoi12 <2,6,3,7>, <3,1,7,1>
-  3852912935U, // <7,3,1,u>: Cost 3 vsldoi12 RHS, <3,1,u,3>
-  3852912944U, // <7,3,2,0>: Cost 3 vsldoi12 RHS, <3,2,0,3>
+  2779171111U, // <7,3,1,u>: Cost 3 vsldoi12 RHS, <3,1,u,3>
+  2779171120U, // <7,3,2,0>: Cost 3 vsldoi12 RHS, <3,2,0,3>
   3852912952U, // <7,3,2,1>: Cost 4 vsldoi12 RHS, <3,2,1,2>
-  3852912961U, // <7,3,2,2>: Cost 3 vsldoi12 RHS, <3,2,2,2>
-  3852912968U, // <7,3,2,3>: Cost 3 vsldoi12 RHS, <3,2,3,0>
-  3852912980U, // <7,3,2,4>: Cost 3 vsldoi12 RHS, <3,2,4,3>
+  2779171137U, // <7,3,2,2>: Cost 3 vsldoi12 RHS, <3,2,2,2>
+  2779171144U, // <7,3,2,3>: Cost 3 vsldoi12 RHS, <3,2,3,0>
+  2779171156U, // <7,3,2,4>: Cost 3 vsldoi12 RHS, <3,2,4,3>
   3852912989U, // <7,3,2,5>: Cost 4 vsldoi12 RHS, <3,2,5,3>
-  3841411430U, // <7,3,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <3,2,6,3>
-  3841411439U, // <7,3,2,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,2,7,3>
-  3852913013U, // <7,3,2,u>: Cost 3 vsldoi12 RHS, <3,2,u,0>
-  3852913022U, // <7,3,3,0>: Cost 3 vsldoi12 RHS, <3,3,0,0>
+  2767669606U, // <7,3,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <3,2,6,3>
+  2767669615U, // <7,3,2,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,2,7,3>
+  2779171189U, // <7,3,2,u>: Cost 3 vsldoi12 RHS, <3,2,u,0>
+  2779171198U, // <7,3,3,0>: Cost 3 vsldoi12 RHS, <3,3,0,0>
   3852913032U, // <7,3,3,1>: Cost 4 vsldoi12 RHS, <3,3,1,1>
-  3777882479U, // <7,3,3,2>: Cost 3 vsldoi8 <3,2,7,3>, <3,2,7,3>
-  2779171228U, // <7,3,3,3>: Cost 2 vsldoi12 RHS, <3,3,3,3>
-  3852913062U, // <7,3,3,4>: Cost 3 vsldoi12 RHS, <3,3,4,4>
+  2704140655U, // <7,3,3,2>: Cost 3 vsldoi8 <3,2,7,3>, <3,2,7,3>
+  1705429404U, // <7,3,3,3>: Cost 2 vsldoi12 RHS, <3,3,3,3>
+  2779171238U, // <7,3,3,4>: Cost 3 vsldoi12 RHS, <3,3,4,4>
   3852913070U, // <7,3,3,5>: Cost 4 vsldoi12 RHS, <3,3,5,3>
-  3731714923U, // <7,3,3,6>: Cost 3 vsldoi4 <6,7,3,3>, <6,7,3,3>
-  3841411524U, // <7,3,3,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,3,7,7>
-  2779171228U, // <7,3,3,u>: Cost 2 vsldoi12 RHS, <3,3,3,3>
-  3852913104U, // <7,3,4,0>: Cost 3 vsldoi12 RHS, <3,4,0,1>
-  3852913114U, // <7,3,4,1>: Cost 3 vsldoi12 RHS, <3,4,1,2>
-  3707832328U, // <7,3,4,2>: Cost 3 vsldoi4 <2,7,3,4>, <2,7,3,4>
-  3852913135U, // <7,3,4,3>: Cost 3 vsldoi12 RHS, <3,4,3,5>
-  3852913143U, // <7,3,4,4>: Cost 3 vsldoi12 RHS, <3,4,4,4>
-  2779171330U, // <7,3,4,5>: Cost 2 vsldoi12 RHS, <3,4,5,6>
-  3795799417U, // <7,3,4,6>: Cost 3 vsldoi8 <6,2,7,3>, <4,6,5,2>
-  3389835194U, // <7,3,4,7>: Cost 3 vmrglw <5,6,7,4>, <2,6,3,7>
-  2779171357U, // <7,3,4,u>: Cost 2 vsldoi12 RHS, <3,4,u,6>
+  2657973099U, // <7,3,3,6>: Cost 3 vsldoi4 <6,7,3,3>, <6,7,3,3>
+  2767669700U, // <7,3,3,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,3,7,7>
+  1705429404U, // <7,3,3,u>: Cost 2 vsldoi12 RHS, <3,3,3,3>
+  2779171280U, // <7,3,4,0>: Cost 3 vsldoi12 RHS, <3,4,0,1>
+  2779171290U, // <7,3,4,1>: Cost 3 vsldoi12 RHS, <3,4,1,2>
+  2634090504U, // <7,3,4,2>: Cost 3 vsldoi4 <2,7,3,4>, <2,7,3,4>
+  2779171311U, // <7,3,4,3>: Cost 3 vsldoi12 RHS, <3,4,3,5>
+  2779171319U, // <7,3,4,4>: Cost 3 vsldoi12 RHS, <3,4,4,4>
+  1705429506U, // <7,3,4,5>: Cost 2 vsldoi12 RHS, <3,4,5,6>
+  2722057593U, // <7,3,4,6>: Cost 3 vsldoi8 <6,2,7,3>, <4,6,5,2>
+  2316093370U, // <7,3,4,7>: Cost 3 vmrglw <5,6,7,4>, <2,6,3,7>
+  1705429533U, // <7,3,4,u>: Cost 2 vsldoi12 RHS, <3,4,u,6>
   3852913185U, // <7,3,5,0>: Cost 4 vsldoi12 RHS, <3,5,0,1>
   3795799695U, // <7,3,5,1>: Cost 4 vsldoi8 <6,2,7,3>, <5,1,0,1>
   3852913203U, // <7,3,5,2>: Cost 4 vsldoi12 RHS, <3,5,2,1>
   3852913214U, // <7,3,5,3>: Cost 4 vsldoi12 RHS, <3,5,3,3>
   3852913225U, // <7,3,5,4>: Cost 4 vsldoi12 RHS, <3,5,4,5>
-  3852913234U, // <7,3,5,5>: Cost 3 vsldoi12 RHS, <3,5,5,5>
-  3792482405U, // <7,3,5,6>: Cost 3 vsldoi8 <5,6,7,3>, <5,6,7,3>
+  2779171410U, // <7,3,5,5>: Cost 3 vsldoi12 RHS, <3,5,5,5>
+  2718740581U, // <7,3,5,6>: Cost 3 vsldoi8 <5,6,7,3>, <5,6,7,3>
   3841411685U, // <7,3,5,7>: Cost 4 vsldoi12 <2,6,3,7>, <3,5,7,6>
-  3793809671U, // <7,3,5,u>: Cost 3 vsldoi8 <5,u,7,3>, <5,u,7,3>
-  3847162488U, // <7,3,6,0>: Cost 3 vsldoi12 <3,6,0,7>, <3,6,0,7>
+  2720067847U, // <7,3,5,u>: Cost 3 vsldoi8 <5,u,7,3>, <5,u,7,3>
+  2773420664U, // <7,3,6,0>: Cost 3 vsldoi12 <3,6,0,7>, <3,6,0,7>
   3847236225U, // <7,3,6,1>: Cost 4 vsldoi12 <3,6,1,7>, <3,6,1,7>
-  2722058746U, // <7,3,6,2>: Cost 2 vsldoi8 <6,2,7,3>, <6,2,7,3>
-  3847383699U, // <7,3,6,3>: Cost 3 vsldoi12 <3,6,3,7>, <3,6,3,7>
-  3847457436U, // <7,3,6,4>: Cost 3 vsldoi12 <3,6,4,7>, <3,6,4,7>
+  1648316922U, // <7,3,6,2>: Cost 2 vsldoi8 <6,2,7,3>, <6,2,7,3>
+  2773641875U, // <7,3,6,3>: Cost 3 vsldoi12 <3,6,3,7>, <3,6,3,7>
+  2773715612U, // <7,3,6,4>: Cost 3 vsldoi12 <3,6,4,7>, <3,6,4,7>
   3847531173U, // <7,3,6,5>: Cost 4 vsldoi12 <3,6,5,7>, <3,6,5,7>
-  3795800848U, // <7,3,6,6>: Cost 3 vsldoi8 <6,2,7,3>, <6,6,2,2>
-  3841411767U, // <7,3,6,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,6,7,7>
-  2726040544U, // <7,3,6,u>: Cost 2 vsldoi8 <6,u,7,3>, <6,u,7,3>
-  3841411779U, // <7,3,7,0>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,0,1>
+  2722059024U, // <7,3,6,6>: Cost 3 vsldoi8 <6,2,7,3>, <6,6,2,2>
+  2767669943U, // <7,3,6,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,6,7,7>
+  1652298720U, // <7,3,6,u>: Cost 2 vsldoi8 <6,u,7,3>, <6,u,7,3>
+  2767669955U, // <7,3,7,0>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,0,1>
   3841411788U, // <7,3,7,1>: Cost 4 vsldoi12 <2,6,3,7>, <3,7,1,1>
-  3841411802U, // <7,3,7,2>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,2,6>
-  3795801370U, // <7,3,7,3>: Cost 3 vsldoi8 <6,2,7,3>, <7,3,6,2>
-  3841411819U, // <7,3,7,4>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,4,5>
+  2767669978U, // <7,3,7,2>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,2,6>
+  2722059546U, // <7,3,7,3>: Cost 3 vsldoi8 <6,2,7,3>, <7,3,6,2>
+  2767669995U, // <7,3,7,4>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,4,5>
   3852913396U, // <7,3,7,5>: Cost 4 vsldoi12 RHS, <3,7,5,5>
-  3795801582U, // <7,3,7,6>: Cost 3 vsldoi8 <6,2,7,3>, <7,6,2,7>
-  3375925178U, // <7,3,7,7>: Cost 3 vmrglw <3,3,7,7>, <2,6,3,7>
-  3841411851U, // <7,3,7,u>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,u,1>
-  3848489754U, // <7,3,u,0>: Cost 3 vsldoi12 <3,u,0,7>, <3,u,0,7>
-  2779171614U, // <7,3,u,1>: Cost 2 vsldoi12 RHS, <3,u,1,2>
-  2734004140U, // <7,3,u,2>: Cost 2 vsldoi8 <u,2,7,3>, <u,2,7,3>
-  2779171228U, // <7,3,u,3>: Cost 2 vsldoi12 RHS, <3,3,3,3>
-  3848784702U, // <7,3,u,4>: Cost 3 vsldoi12 <3,u,4,7>, <3,u,4,7>
-  2779171654U, // <7,3,u,5>: Cost 2 vsldoi12 RHS, <3,u,5,6>
-  3852913484U, // <7,3,u,6>: Cost 3 vsldoi12 RHS, <3,u,6,3>
-  3841411925U, // <7,3,u,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,u,7,3>
-  2779171677U, // <7,3,u,u>: Cost 2 vsldoi12 RHS, <3,u,u,2>
-  3792486400U, // <7,4,0,0>: Cost 3 vsldoi8 <5,6,7,4>, <0,0,0,0>
-  2718744678U, // <7,4,0,1>: Cost 2 vsldoi8 <5,6,7,4>, LHS
+  2722059758U, // <7,3,7,6>: Cost 3 vsldoi8 <6,2,7,3>, <7,6,2,7>
+  2302183354U, // <7,3,7,7>: Cost 3 vmrglw <3,3,7,7>, <2,6,3,7>
+  2767670027U, // <7,3,7,u>: Cost 3 vsldoi12 <2,6,3,7>, <3,7,u,1>
+  2774747930U, // <7,3,u,0>: Cost 3 vsldoi12 <3,u,0,7>, <3,u,0,7>
+  1705429790U, // <7,3,u,1>: Cost 2 vsldoi12 RHS, <3,u,1,2>
+  1660262316U, // <7,3,u,2>: Cost 2 vsldoi8 <u,2,7,3>, <u,2,7,3>
+  1705429404U, // <7,3,u,3>: Cost 2 vsldoi12 RHS, <3,3,3,3>
+  2775042878U, // <7,3,u,4>: Cost 3 vsldoi12 <3,u,4,7>, <3,u,4,7>
+  1705429830U, // <7,3,u,5>: Cost 2 vsldoi12 RHS, <3,u,5,6>
+  2779171660U, // <7,3,u,6>: Cost 3 vsldoi12 RHS, <3,u,6,3>
+  2767670101U, // <7,3,u,7>: Cost 3 vsldoi12 <2,6,3,7>, <3,u,7,3>
+  1705429853U, // <7,3,u,u>: Cost 2 vsldoi12 RHS, <3,u,u,2>
+  2718744576U, // <7,4,0,0>: Cost 3 vsldoi8 <5,6,7,4>, <0,0,0,0>
+  1645002854U, // <7,4,0,1>: Cost 2 vsldoi8 <5,6,7,4>, LHS
   3852913527U, // <7,4,0,2>: Cost 4 vsldoi12 RHS, <4,0,2,1>
   3852913536U, // <7,4,0,3>: Cost 4 vsldoi12 RHS, <4,0,3,1>
-  3389803728U, // <7,4,0,4>: Cost 3 vmrglw <5,6,7,0>, <4,4,4,4>
-  2779171730U, // <7,4,0,5>: Cost 2 vsldoi12 RHS, <4,0,5,1>
-  3731764081U, // <7,4,0,6>: Cost 3 vsldoi4 <6,7,4,0>, <6,7,4,0>
-  3330231752U, // <7,4,0,7>: Cost 3 vmrghw <7,0,1,2>, <4,7,5,0>
-  2781162413U, // <7,4,0,u>: Cost 2 vsldoi12 RHS, <4,0,u,1>
+  2316061904U, // <7,4,0,4>: Cost 3 vmrglw <5,6,7,0>, <4,4,4,4>
+  1705429906U, // <7,4,0,5>: Cost 2 vsldoi12 RHS, <4,0,5,1>
+  2658022257U, // <7,4,0,6>: Cost 3 vsldoi4 <6,7,4,0>, <6,7,4,0>
+  2256489928U, // <7,4,0,7>: Cost 3 vmrghw <7,0,1,2>, <4,7,5,0>
+  1707420589U, // <7,4,0,u>: Cost 2 vsldoi12 RHS, <4,0,u,1>
   3852913590U, // <7,4,1,0>: Cost 4 vsldoi12 RHS, <4,1,0,1>
-  3792487220U, // <7,4,1,1>: Cost 3 vsldoi8 <5,6,7,4>, <1,1,1,1>
-  3852913610U, // <7,4,1,2>: Cost 3 vsldoi12 RHS, <4,1,2,3>
+  2718745396U, // <7,4,1,1>: Cost 3 vsldoi8 <5,6,7,4>, <1,1,1,1>
+  2779171786U, // <7,4,1,2>: Cost 3 vsldoi12 RHS, <4,1,2,3>
   3852913616U, // <7,4,1,3>: Cost 4 vsldoi12 RHS, <4,1,3,0>
   3852913627U, // <7,4,1,4>: Cost 4 vsldoi12 RHS, <4,1,4,2>
-  3852913634U, // <7,4,1,5>: Cost 3 vsldoi12 RHS, <4,1,5,0>
+  2779171810U, // <7,4,1,5>: Cost 3 vsldoi12 RHS, <4,1,5,0>
   3792487631U, // <7,4,1,6>: Cost 4 vsldoi8 <5,6,7,4>, <1,6,1,7>
   3394456220U, // <7,4,1,7>: Cost 4 vmrglw <6,4,7,1>, <3,6,4,7>
-  3852913661U, // <7,4,1,u>: Cost 3 vsldoi12 RHS, <4,1,u,0>
+  2779171837U, // <7,4,1,u>: Cost 3 vsldoi12 RHS, <4,1,u,0>
   3852913673U, // <7,4,2,0>: Cost 4 vsldoi12 RHS, <4,2,0,3>
   3852913682U, // <7,4,2,1>: Cost 4 vsldoi12 RHS, <4,2,1,3>
-  3792488040U, // <7,4,2,2>: Cost 3 vsldoi8 <5,6,7,4>, <2,2,2,2>
-  3792488102U, // <7,4,2,3>: Cost 3 vsldoi8 <5,6,7,4>, <2,3,0,1>
-  3852913709U, // <7,4,2,4>: Cost 3 vsldoi12 RHS, <4,2,4,3>
-  3852913717U, // <7,4,2,5>: Cost 3 vsldoi12 RHS, <4,2,5,2>
-  3792488378U, // <7,4,2,6>: Cost 3 vsldoi8 <5,6,7,4>, <2,6,3,7>
+  2718746216U, // <7,4,2,2>: Cost 3 vsldoi8 <5,6,7,4>, <2,2,2,2>
+  2718746278U, // <7,4,2,3>: Cost 3 vsldoi8 <5,6,7,4>, <2,3,0,1>
+  2779171885U, // <7,4,2,4>: Cost 3 vsldoi12 RHS, <4,2,4,3>
+  2779171893U, // <7,4,2,5>: Cost 3 vsldoi12 RHS, <4,2,5,2>
+  2718746554U, // <7,4,2,6>: Cost 3 vsldoi8 <5,6,7,4>, <2,6,3,7>
   3847457864U, // <7,4,2,7>: Cost 4 vsldoi12 <3,6,4,7>, <4,2,7,3>
-  3852913745U, // <7,4,2,u>: Cost 3 vsldoi12 RHS, <4,2,u,3>
-  3792488598U, // <7,4,3,0>: Cost 3 vsldoi8 <5,6,7,4>, <3,0,1,2>
+  2779171921U, // <7,4,2,u>: Cost 3 vsldoi12 RHS, <4,2,u,3>
+  2718746774U, // <7,4,3,0>: Cost 3 vsldoi8 <5,6,7,4>, <3,0,1,2>
   3852913762U, // <7,4,3,1>: Cost 4 vsldoi12 RHS, <4,3,1,2>
   3852913772U, // <7,4,3,2>: Cost 4 vsldoi12 RHS, <4,3,2,3>
-  3792488860U, // <7,4,3,3>: Cost 3 vsldoi8 <5,6,7,4>, <3,3,3,3>
-  3792488962U, // <7,4,3,4>: Cost 3 vsldoi8 <5,6,7,4>, <3,4,5,6>
-  3852913796U, // <7,4,3,5>: Cost 3 vsldoi12 RHS, <4,3,5,0>
-  3780545204U, // <7,4,3,6>: Cost 3 vsldoi8 <3,6,7,4>, <3,6,7,4>
+  2718747036U, // <7,4,3,3>: Cost 3 vsldoi8 <5,6,7,4>, <3,3,3,3>
+  2718747138U, // <7,4,3,4>: Cost 3 vsldoi8 <5,6,7,4>, <3,4,5,6>
+  2779171972U, // <7,4,3,5>: Cost 3 vsldoi12 RHS, <4,3,5,0>
+  2706803380U, // <7,4,3,6>: Cost 3 vsldoi8 <3,6,7,4>, <3,6,7,4>
   3847457946U, // <7,4,3,7>: Cost 4 vsldoi12 <3,6,4,7>, <4,3,7,4>
-  3854904479U, // <7,4,3,u>: Cost 3 vsldoi12 RHS, <4,3,u,0>
-  3792489362U, // <7,4,4,0>: Cost 3 vsldoi8 <5,6,7,4>, <4,0,5,1>
+  2781162655U, // <7,4,3,u>: Cost 3 vsldoi12 RHS, <4,3,u,0>
+  2718747538U, // <7,4,4,0>: Cost 3 vsldoi8 <5,6,7,4>, <4,0,5,1>
   3852913842U, // <7,4,4,1>: Cost 4 vsldoi12 RHS, <4,4,1,1>
   3852913852U, // <7,4,4,2>: Cost 4 vsldoi12 RHS, <4,4,2,2>
-  3389838520U, // <7,4,4,3>: Cost 3 vmrglw <5,6,7,4>, <7,2,4,3>
-  2779172048U, // <7,4,4,4>: Cost 2 vsldoi12 RHS, <4,4,4,4>
-  2779172058U, // <7,4,4,5>: Cost 2 vsldoi12 RHS, <4,4,5,5>
-  3731796853U, // <7,4,4,6>: Cost 3 vsldoi4 <6,7,4,4>, <6,7,4,4>
-  3389838848U, // <7,4,4,7>: Cost 3 vmrglw <5,6,7,4>, <7,6,4,7>
-  2781162741U, // <7,4,4,u>: Cost 2 vsldoi12 RHS, <4,4,u,5>
-  2658058342U, // <7,4,5,0>: Cost 2 vsldoi4 <6,7,4,5>, LHS
-  3731800884U, // <7,4,5,1>: Cost 3 vsldoi4 <6,7,4,5>, <1,1,1,1>
-  3713886138U, // <7,4,5,2>: Cost 3 vsldoi4 <3,7,4,5>, <2,6,3,7>
-  3713886955U, // <7,4,5,3>: Cost 3 vsldoi4 <3,7,4,5>, <3,7,4,5>
-  2658061622U, // <7,4,5,4>: Cost 2 vsldoi4 <6,7,4,5>, RHS
-  3852913958U, // <7,4,5,5>: Cost 3 vsldoi12 RHS, <4,5,5,0>
-  1705430326U, // <7,4,5,6>: Cost 1 vsldoi12 RHS, RHS
-  3731805178U, // <7,4,5,7>: Cost 3 vsldoi4 <6,7,4,5>, <7,0,1,2>
-  1705430344U, // <7,4,5,u>: Cost 1 vsldoi12 RHS, RHS
+  2316096696U, // <7,4,4,3>: Cost 3 vmrglw <5,6,7,4>, <7,2,4,3>
+  1705430224U, // <7,4,4,4>: Cost 2 vsldoi12 RHS, <4,4,4,4>
+  1705430234U, // <7,4,4,5>: Cost 2 vsldoi12 RHS, <4,4,5,5>
+  2658055029U, // <7,4,4,6>: Cost 3 vsldoi4 <6,7,4,4>, <6,7,4,4>
+  2316097024U, // <7,4,4,7>: Cost 3 vmrglw <5,6,7,4>, <7,6,4,7>
+  1707420917U, // <7,4,4,u>: Cost 2 vsldoi12 RHS, <4,4,u,5>
+  1584316518U, // <7,4,5,0>: Cost 2 vsldoi4 <6,7,4,5>, LHS
+  2658059060U, // <7,4,5,1>: Cost 3 vsldoi4 <6,7,4,5>, <1,1,1,1>
+  2640144314U, // <7,4,5,2>: Cost 3 vsldoi4 <3,7,4,5>, <2,6,3,7>
+  2640145131U, // <7,4,5,3>: Cost 3 vsldoi4 <3,7,4,5>, <3,7,4,5>
+  1584319798U, // <7,4,5,4>: Cost 2 vsldoi4 <6,7,4,5>, RHS
+  2779172134U, // <7,4,5,5>: Cost 3 vsldoi12 RHS, <4,5,5,0>
+  631688502U,  // <7,4,5,6>: Cost 1 vsldoi12 RHS, RHS
+  2658063354U, // <7,4,5,7>: Cost 3 vsldoi4 <6,7,4,5>, <7,0,1,2>
+  631688520U,  // <7,4,5,u>: Cost 1 vsldoi12 RHS, RHS
   3852914001U, // <7,4,6,0>: Cost 4 vsldoi12 RHS, <4,6,0,7>
   3852914010U, // <7,4,6,1>: Cost 4 vsldoi12 RHS, <4,6,1,7>
-  3792491002U, // <7,4,6,2>: Cost 3 vsldoi8 <5,6,7,4>, <6,2,7,3>
-  3796472396U, // <7,4,6,3>: Cost 3 vsldoi8 <6,3,7,4>, <6,3,7,4>
-  3797136029U, // <7,4,6,4>: Cost 3 vsldoi8 <6,4,7,4>, <6,4,7,4>
-  3852914045U, // <7,4,6,5>: Cost 3 vsldoi12 RHS, <4,6,5,6>
-  3792491320U, // <7,4,6,6>: Cost 3 vsldoi8 <5,6,7,4>, <6,6,6,6>
-  3792491342U, // <7,4,6,7>: Cost 3 vsldoi8 <5,6,7,4>, <6,7,0,1>
-  3852914073U, // <7,4,6,u>: Cost 3 vsldoi12 RHS, <4,6,u,7>
-  3792491514U, // <7,4,7,0>: Cost 3 vsldoi8 <5,6,7,4>, <7,0,1,2>
+  2718749178U, // <7,4,6,2>: Cost 3 vsldoi8 <5,6,7,4>, <6,2,7,3>
+  2722730572U, // <7,4,6,3>: Cost 3 vsldoi8 <6,3,7,4>, <6,3,7,4>
+  2723394205U, // <7,4,6,4>: Cost 3 vsldoi8 <6,4,7,4>, <6,4,7,4>
+  2779172221U, // <7,4,6,5>: Cost 3 vsldoi12 RHS, <4,6,5,6>
+  2718749496U, // <7,4,6,6>: Cost 3 vsldoi8 <5,6,7,4>, <6,6,6,6>
+  2718749518U, // <7,4,6,7>: Cost 3 vsldoi8 <5,6,7,4>, <6,7,0,1>
+  2779172249U, // <7,4,6,u>: Cost 3 vsldoi12 RHS, <4,6,u,7>
+  2718749690U, // <7,4,7,0>: Cost 3 vsldoi8 <5,6,7,4>, <7,0,1,2>
   3847458214U, // <7,4,7,1>: Cost 4 vsldoi12 <3,6,4,7>, <4,7,1,2>
-  3792491704U, // <7,4,7,2>: Cost 3 vsldoi8 <5,6,7,4>, <7,2,4,3>
+  2718749880U, // <7,4,7,2>: Cost 3 vsldoi8 <5,6,7,4>, <7,2,4,3>
   3847458236U, // <7,4,7,3>: Cost 4 vsldoi12 <3,6,4,7>, <4,7,3,6>
-  3792491828U, // <7,4,7,4>: Cost 3 vsldoi8 <5,6,7,4>, <7,4,0,1>
-  2261617974U, // <7,4,7,5>: Cost 2 vmrghw <7,7,7,7>, RHS
-  3792492032U, // <7,4,7,6>: Cost 3 vsldoi8 <5,6,7,4>, <7,6,4,7>
-  3792492110U, // <7,4,7,7>: Cost 3 vsldoi8 <5,6,7,4>, <7,7,4,4>
-  2261618217U, // <7,4,7,u>: Cost 2 vmrghw <7,7,7,7>, RHS
-  2658082918U, // <7,4,u,0>: Cost 2 vsldoi4 <6,7,4,u>, LHS
-  2718750510U, // <7,4,u,1>: Cost 2 vsldoi8 <5,6,7,4>, LHS
-  3713910714U, // <7,4,u,2>: Cost 3 vsldoi4 <3,7,4,u>, <2,6,3,7>
-  3713911534U, // <7,4,u,3>: Cost 3 vsldoi4 <3,7,4,u>, <3,7,4,u>
-  2658086198U, // <7,4,u,4>: Cost 2 vsldoi4 <6,7,4,u>, RHS
-  2779172378U, // <7,4,u,5>: Cost 2 vsldoi12 RHS, <4,u,5,1>
-  1705430569U, // <7,4,u,6>: Cost 1 vsldoi12 RHS, RHS
-  3792492800U, // <7,4,u,7>: Cost 3 vsldoi8 <5,6,7,4>, <u,7,0,1>
-  1705430587U, // <7,4,u,u>: Cost 1 vsldoi12 RHS, RHS
-  3719888998U, // <7,5,0,0>: Cost 3 vsldoi4 <4,7,5,0>, LHS
-  3852914248U, // <7,5,0,1>: Cost 3 vsldoi12 RHS, <5,0,1,2>
+  2718750004U, // <7,4,7,4>: Cost 3 vsldoi8 <5,6,7,4>, <7,4,0,1>
+  1187876150U, // <7,4,7,5>: Cost 2 vmrghw <7,7,7,7>, RHS
+  2718750208U, // <7,4,7,6>: Cost 3 vsldoi8 <5,6,7,4>, <7,6,4,7>
+  2718750286U, // <7,4,7,7>: Cost 3 vsldoi8 <5,6,7,4>, <7,7,4,4>
+  1187876393U, // <7,4,7,u>: Cost 2 vmrghw <7,7,7,7>, RHS
+  1584341094U, // <7,4,u,0>: Cost 2 vsldoi4 <6,7,4,u>, LHS
+  1645008686U, // <7,4,u,1>: Cost 2 vsldoi8 <5,6,7,4>, LHS
+  2640168890U, // <7,4,u,2>: Cost 3 vsldoi4 <3,7,4,u>, <2,6,3,7>
+  2640169710U, // <7,4,u,3>: Cost 3 vsldoi4 <3,7,4,u>, <3,7,4,u>
+  1584344374U, // <7,4,u,4>: Cost 2 vsldoi4 <6,7,4,u>, RHS
+  1705430554U, // <7,4,u,5>: Cost 2 vsldoi12 RHS, <4,u,5,1>
+  631688745U,  // <7,4,u,6>: Cost 1 vsldoi12 RHS, RHS
+  2718750976U, // <7,4,u,7>: Cost 3 vsldoi8 <5,6,7,4>, <u,7,0,1>
+  631688763U,  // <7,4,u,u>: Cost 1 vsldoi12 RHS, RHS
+  2646147174U, // <7,5,0,0>: Cost 3 vsldoi4 <4,7,5,0>, LHS
+  2779172424U, // <7,5,0,1>: Cost 3 vsldoi12 RHS, <5,0,1,2>
   3852914258U, // <7,5,0,2>: Cost 4 vsldoi12 RHS, <5,0,2,3>
   3852914268U, // <7,5,0,3>: Cost 4 vsldoi12 RHS, <5,0,3,4>
-  3852914274U, // <7,5,0,4>: Cost 3 vsldoi12 RHS, <5,0,4,1>
-  3389803738U, // <7,5,0,5>: Cost 3 vmrglw <5,6,7,0>, <4,4,5,5>
-  3389803010U, // <7,5,0,6>: Cost 3 vmrglw <5,6,7,0>, <3,4,5,6>
-  3719894010U, // <7,5,0,7>: Cost 3 vsldoi4 <4,7,5,0>, <7,0,1,2>
-  3852914310U, // <7,5,0,u>: Cost 3 vsldoi12 RHS, <5,0,u,1>
-  3854904975U, // <7,5,1,0>: Cost 3 vsldoi12 RHS, <5,1,0,1>
-  3395120018U, // <7,5,1,1>: Cost 3 vmrglw <6,5,7,1>, <4,0,5,1>
+  2779172450U, // <7,5,0,4>: Cost 3 vsldoi12 RHS, <5,0,4,1>
+  2316061914U, // <7,5,0,5>: Cost 3 vmrglw <5,6,7,0>, <4,4,5,5>
+  2316061186U, // <7,5,0,6>: Cost 3 vmrglw <5,6,7,0>, <3,4,5,6>
+  2646152186U, // <7,5,0,7>: Cost 3 vsldoi4 <4,7,5,0>, <7,0,1,2>
+  2779172486U, // <7,5,0,u>: Cost 3 vsldoi12 RHS, <5,0,u,1>
+  2781163151U, // <7,5,1,0>: Cost 3 vsldoi12 RHS, <5,1,0,1>
+  2321378194U, // <7,5,1,1>: Cost 3 vmrglw <6,5,7,1>, <4,0,5,1>
   3852914339U, // <7,5,1,2>: Cost 4 vsldoi12 RHS, <5,1,2,3>
   3852914350U, // <7,5,1,3>: Cost 4 vsldoi12 RHS, <5,1,3,5>
-  3854905015U, // <7,5,1,4>: Cost 3 vsldoi12 RHS, <5,1,4,5>
+  2781163191U, // <7,5,1,4>: Cost 3 vsldoi12 RHS, <5,1,4,5>
   3852914363U, // <7,5,1,5>: Cost 4 vsldoi12 RHS, <5,1,5,0>
   3835588297U, // <7,5,1,6>: Cost 4 vsldoi12 <1,6,5,7>, <5,1,6,5>
   3835588306U, // <7,5,1,7>: Cost 4 vsldoi12 <1,6,5,7>, <5,1,7,5>
-  3854905047U, // <7,5,1,u>: Cost 3 vsldoi12 RHS, <5,1,u,1>
+  2781163223U, // <7,5,1,u>: Cost 3 vsldoi12 RHS, <5,1,u,1>
   3852914400U, // <7,5,2,0>: Cost 4 vsldoi12 RHS, <5,2,0,1>
-  3854905067U, // <7,5,2,1>: Cost 3 vsldoi12 RHS, <5,2,1,3>
+  2781163243U, // <7,5,2,1>: Cost 3 vsldoi12 RHS, <5,2,1,3>
   3852914419U, // <7,5,2,2>: Cost 4 vsldoi12 RHS, <5,2,2,2>
-  3852914430U, // <7,5,2,3>: Cost 3 vsldoi12 RHS, <5,2,3,4>
+  2779172606U, // <7,5,2,3>: Cost 3 vsldoi12 RHS, <5,2,3,4>
   3780552497U, // <7,5,2,4>: Cost 4 vsldoi8 <3,6,7,5>, <2,4,6,5>
-  3854905103U, // <7,5,2,5>: Cost 3 vsldoi12 RHS, <5,2,5,3>
-  3852914456U, // <7,5,2,6>: Cost 3 vsldoi12 RHS, <5,2,6,3>
+  2781163279U, // <7,5,2,5>: Cost 3 vsldoi12 RHS, <5,2,5,3>
+  2779172632U, // <7,5,2,6>: Cost 3 vsldoi12 RHS, <5,2,6,3>
   3835588385U, // <7,5,2,7>: Cost 4 vsldoi12 <1,6,5,7>, <5,2,7,3>
-  3852914474U, // <7,5,2,u>: Cost 3 vsldoi12 RHS, <5,2,u,3>
+  2779172650U, // <7,5,2,u>: Cost 3 vsldoi12 RHS, <5,2,u,3>
   3852914481U, // <7,5,3,0>: Cost 4 vsldoi12 RHS, <5,3,0,1>
-  3393145746U, // <7,5,3,1>: Cost 3 vmrglw <6,2,7,3>, <4,0,5,1>
-  3393146233U, // <7,5,3,2>: Cost 3 vmrglw <6,2,7,3>, <4,6,5,2>
+  2319403922U, // <7,5,3,1>: Cost 3 vmrglw <6,2,7,3>, <4,0,5,1>
+  2319404409U, // <7,5,3,2>: Cost 3 vmrglw <6,2,7,3>, <4,6,5,2>
   3852914510U, // <7,5,3,3>: Cost 4 vsldoi12 RHS, <5,3,3,3>
   3779226131U, // <7,5,3,4>: Cost 4 vsldoi8 <3,4,7,5>, <3,4,7,5>
-  3393146074U, // <7,5,3,5>: Cost 3 vmrglw <6,2,7,3>, <4,4,5,5>
-  3393145346U, // <7,5,3,6>: Cost 3 vmrglw <6,2,7,3>, <3,4,5,6>
+  2319404250U, // <7,5,3,5>: Cost 3 vmrglw <6,2,7,3>, <4,4,5,5>
+  2319403522U, // <7,5,3,6>: Cost 3 vmrglw <6,2,7,3>, <3,4,5,6>
   3852914547U, // <7,5,3,7>: Cost 4 vsldoi12 RHS, <5,3,7,4>
-  3393145348U, // <7,5,3,u>: Cost 3 vmrglw <6,2,7,3>, <3,4,5,u>
-  3719921766U, // <7,5,4,0>: Cost 3 vsldoi4 <4,7,5,4>, LHS
-  3389836178U, // <7,5,4,1>: Cost 3 vmrglw <5,6,7,4>, <4,0,5,1>
+  2319403524U, // <7,5,3,u>: Cost 3 vmrglw <6,2,7,3>, <3,4,5,u>
+  2646179942U, // <7,5,4,0>: Cost 3 vsldoi4 <4,7,5,4>, LHS
+  2316094354U, // <7,5,4,1>: Cost 3 vmrglw <5,6,7,4>, <4,0,5,1>
   3852914582U, // <7,5,4,2>: Cost 4 vsldoi12 RHS, <5,4,2,3>
   3852914592U, // <7,5,4,3>: Cost 4 vsldoi12 RHS, <5,4,3,4>
-  3719925196U, // <7,5,4,4>: Cost 3 vsldoi4 <4,7,5,4>, <4,7,5,4>
-  3852914612U, // <7,5,4,5>: Cost 3 vsldoi12 RHS, <5,4,5,6>
-  3389835778U, // <7,5,4,6>: Cost 3 vmrglw <5,6,7,4>, <3,4,5,6>
-  3719927142U, // <7,5,4,7>: Cost 3 vsldoi4 <4,7,5,4>, <7,4,5,6>
-  3852914639U, // <7,5,4,u>: Cost 3 vsldoi12 RHS, <5,4,u,6>
-  3854905299U, // <7,5,5,0>: Cost 3 vsldoi12 RHS, <5,5,0,1>
-  3854905308U, // <7,5,5,1>: Cost 3 vsldoi12 RHS, <5,5,1,1>
+  2646183372U, // <7,5,4,4>: Cost 3 vsldoi4 <4,7,5,4>, <4,7,5,4>
+  2779172788U, // <7,5,4,5>: Cost 3 vsldoi12 RHS, <5,4,5,6>
+  2316093954U, // <7,5,4,6>: Cost 3 vmrglw <5,6,7,4>, <3,4,5,6>
+  2646185318U, // <7,5,4,7>: Cost 3 vsldoi4 <4,7,5,4>, <7,4,5,6>
+  2779172815U, // <7,5,4,u>: Cost 3 vsldoi12 RHS, <5,4,u,6>
+  2781163475U, // <7,5,5,0>: Cost 3 vsldoi12 RHS, <5,5,0,1>
+  2781163484U, // <7,5,5,1>: Cost 3 vsldoi12 RHS, <5,5,1,1>
   3852914662U, // <7,5,5,2>: Cost 4 vsldoi12 RHS, <5,5,2,2>
   3852914672U, // <7,5,5,3>: Cost 4 vsldoi12 RHS, <5,5,3,3>
-  3854905339U, // <7,5,5,4>: Cost 3 vsldoi12 RHS, <5,5,4,5>
-  2779172868U, // <7,5,5,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
-  3852914702U, // <7,5,5,6>: Cost 3 vsldoi12 RHS, <5,5,6,6>
+  2781163515U, // <7,5,5,4>: Cost 3 vsldoi12 RHS, <5,5,4,5>
+  1705431044U, // <7,5,5,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
+  2779172878U, // <7,5,5,6>: Cost 3 vsldoi12 RHS, <5,5,6,6>
   3835588632U, // <7,5,5,7>: Cost 4 vsldoi12 <1,6,5,7>, <5,5,7,7>
-  2779172868U, // <7,5,5,u>: Cost 2 vsldoi12 RHS, <5,5,5,5>
-  3852914724U, // <7,5,6,0>: Cost 3 vsldoi12 RHS, <5,6,0,1>
-  3854905395U, // <7,5,6,1>: Cost 3 vsldoi12 RHS, <5,6,1,7>
+  1705431044U, // <7,5,5,u>: Cost 2 vsldoi12 RHS, <5,5,5,5>
+  2779172900U, // <7,5,6,0>: Cost 3 vsldoi12 RHS, <5,6,0,1>
+  2781163571U, // <7,5,6,1>: Cost 3 vsldoi12 RHS, <5,6,1,7>
   3852914743U, // <7,5,6,2>: Cost 4 vsldoi12 RHS, <5,6,2,2>
-  3852914754U, // <7,5,6,3>: Cost 3 vsldoi12 RHS, <5,6,3,4>
-  3852914764U, // <7,5,6,4>: Cost 3 vsldoi12 RHS, <5,6,4,5>
-  3854905431U, // <7,5,6,5>: Cost 3 vsldoi12 RHS, <5,6,5,7>
-  3852914784U, // <7,5,6,6>: Cost 3 vsldoi12 RHS, <5,6,6,7>
-  2779172962U, // <7,5,6,7>: Cost 2 vsldoi12 RHS, <5,6,7,0>
-  2779320427U, // <7,5,6,u>: Cost 2 vsldoi12 RHS, <5,6,u,0>
-  3719946342U, // <7,5,7,0>: Cost 3 vsldoi4 <4,7,5,7>, LHS
-  3395832722U, // <7,5,7,1>: Cost 3 vmrglw <6,6,7,7>, <4,0,5,1>
+  2779172930U, // <7,5,6,3>: Cost 3 vsldoi12 RHS, <5,6,3,4>
+  2779172940U, // <7,5,6,4>: Cost 3 vsldoi12 RHS, <5,6,4,5>
+  2781163607U, // <7,5,6,5>: Cost 3 vsldoi12 RHS, <5,6,5,7>
+  2779172960U, // <7,5,6,6>: Cost 3 vsldoi12 RHS, <5,6,6,7>
+  1705431138U, // <7,5,6,7>: Cost 2 vsldoi12 RHS, <5,6,7,0>
+  1705578603U, // <7,5,6,u>: Cost 2 vsldoi12 RHS, <5,6,u,0>
+  2646204518U, // <7,5,7,0>: Cost 3 vsldoi4 <4,7,5,7>, LHS
+  2322090898U, // <7,5,7,1>: Cost 3 vmrglw <6,6,7,7>, <4,0,5,1>
   3719947880U, // <7,5,7,2>: Cost 4 vsldoi4 <4,7,5,7>, <2,2,2,2>
   3719948438U, // <7,5,7,3>: Cost 4 vsldoi4 <4,7,5,7>, <3,0,1,2>
-  3719949775U, // <7,5,7,4>: Cost 3 vsldoi4 <4,7,5,7>, <4,7,5,7>
-  3395833050U, // <7,5,7,5>: Cost 3 vmrglw <6,6,7,7>, <4,4,5,5>
-  3395832322U, // <7,5,7,6>: Cost 3 vmrglw <6,6,7,7>, <3,4,5,6>
-  3719951980U, // <7,5,7,7>: Cost 3 vsldoi4 <4,7,5,7>, <7,7,7,7>
-  3719952174U, // <7,5,7,u>: Cost 3 vsldoi4 <4,7,5,7>, LHS
-  3852914886U, // <7,5,u,0>: Cost 3 vsldoi12 RHS, <5,u,0,1>
-  3852914896U, // <7,5,u,1>: Cost 3 vsldoi12 RHS, <5,u,1,2>
-  3393146233U, // <7,5,u,2>: Cost 3 vmrglw <6,2,7,3>, <4,6,5,2>
-  3852914916U, // <7,5,u,3>: Cost 3 vsldoi12 RHS, <5,u,3,4>
-  3852914925U, // <7,5,u,4>: Cost 3 vsldoi12 RHS, <5,u,4,4>
-  2779172868U, // <7,5,u,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
-  3852914942U, // <7,5,u,6>: Cost 3 vsldoi12 RHS, <5,u,6,3>
-  2779320580U, // <7,5,u,7>: Cost 2 vsldoi12 RHS, <5,u,7,0>
-  2781163789U, // <7,5,u,u>: Cost 2 vsldoi12 RHS, <5,u,u,0>
+  2646207951U, // <7,5,7,4>: Cost 3 vsldoi4 <4,7,5,7>, <4,7,5,7>
+  2322091226U, // <7,5,7,5>: Cost 3 vmrglw <6,6,7,7>, <4,4,5,5>
+  2322090498U, // <7,5,7,6>: Cost 3 vmrglw <6,6,7,7>, <3,4,5,6>
+  2646210156U, // <7,5,7,7>: Cost 3 vsldoi4 <4,7,5,7>, <7,7,7,7>
+  2646210350U, // <7,5,7,u>: Cost 3 vsldoi4 <4,7,5,7>, LHS
+  2779173062U, // <7,5,u,0>: Cost 3 vsldoi12 RHS, <5,u,0,1>
+  2779173072U, // <7,5,u,1>: Cost 3 vsldoi12 RHS, <5,u,1,2>
+  2319404409U, // <7,5,u,2>: Cost 3 vmrglw <6,2,7,3>, <4,6,5,2>
+  2779173092U, // <7,5,u,3>: Cost 3 vsldoi12 RHS, <5,u,3,4>
+  2779173101U, // <7,5,u,4>: Cost 3 vsldoi12 RHS, <5,u,4,4>
+  1705431044U, // <7,5,u,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
+  2779173118U, // <7,5,u,6>: Cost 3 vsldoi12 RHS, <5,u,6,3>
+  1705578756U, // <7,5,u,7>: Cost 2 vsldoi12 RHS, <5,u,7,0>
+  1707421965U, // <7,5,u,u>: Cost 2 vsldoi12 RHS, <5,u,u,0>
   3852914966U, // <7,6,0,0>: Cost 4 vsldoi12 RHS, <6,0,0,0>
-  3852914977U, // <7,6,0,1>: Cost 3 vsldoi12 RHS, <6,0,1,2>
-  3330232826U, // <7,6,0,2>: Cost 3 vmrghw <7,0,1,2>, <6,2,7,3>
+  2779173153U, // <7,6,0,1>: Cost 3 vsldoi12 RHS, <6,0,1,2>
+  2256491002U, // <7,6,0,2>: Cost 3 vmrghw <7,0,1,2>, <6,2,7,3>
   3852914994U, // <7,6,0,3>: Cost 4 vsldoi12 RHS, <6,0,3,1>
   3852915003U, // <7,6,0,4>: Cost 4 vsldoi12 RHS, <6,0,4,1>
-  3389804476U, // <7,6,0,5>: Cost 3 vmrglw <5,6,7,0>, <5,4,6,5>
-  3389805368U, // <7,6,0,6>: Cost 3 vmrglw <5,6,7,0>, <6,6,6,6>
-  2316062006U, // <7,6,0,7>: Cost 2 vmrglw <5,6,7,0>, RHS
-  2316062007U, // <7,6,0,u>: Cost 2 vmrglw <5,6,7,0>, RHS
+  2316062652U, // <7,6,0,5>: Cost 3 vmrglw <5,6,7,0>, <5,4,6,5>
+  2316063544U, // <7,6,0,6>: Cost 3 vmrglw <5,6,7,0>, <6,6,6,6>
+  1242320182U, // <7,6,0,7>: Cost 2 vmrglw <5,6,7,0>, RHS
+  1242320183U, // <7,6,0,u>: Cost 2 vmrglw <5,6,7,0>, RHS
   3852915048U, // <7,6,1,0>: Cost 4 vsldoi12 RHS, <6,1,0,1>
   3377866217U, // <7,6,1,1>: Cost 4 vmrglw <3,6,7,1>, <2,0,6,1>
   3852915068U, // <7,6,1,2>: Cost 4 vsldoi12 RHS, <6,1,2,3>
@@ -5626,960 +5626,960 @@ static const unsigned PerfectShuffleTable[6561+1] = {
   3852915088U, // <7,6,1,4>: Cost 4 vsldoi12 RHS, <6,1,4,5>
   3395122056U, // <7,6,1,5>: Cost 4 vmrglw <6,5,7,1>, <6,7,6,5>
   3389813560U, // <7,6,1,6>: Cost 4 vmrglw <5,6,7,1>, <6,6,6,6>
-  3852915111U, // <7,6,1,7>: Cost 3 vsldoi12 RHS, <6,1,7,1>
-  3853062576U, // <7,6,1,u>: Cost 3 vsldoi12 RHS, <6,1,u,1>
-  3731923046U, // <7,6,2,0>: Cost 3 vsldoi4 <6,7,6,2>, LHS
+  2779173287U, // <7,6,1,7>: Cost 3 vsldoi12 RHS, <6,1,7,1>
+  2779320752U, // <7,6,1,u>: Cost 3 vsldoi12 RHS, <6,1,u,1>
+  2658181222U, // <7,6,2,0>: Cost 3 vsldoi4 <6,7,6,2>, LHS
   3852915140U, // <7,6,2,1>: Cost 4 vsldoi12 RHS, <6,2,1,3>
-  3331715578U, // <7,6,2,2>: Cost 3 vmrghw <7,2,3,3>, <6,2,7,3>
+  2257973754U, // <7,6,2,2>: Cost 3 vmrghw <7,2,3,3>, <6,2,7,3>
   3841413589U, // <7,6,2,3>: Cost 4 vsldoi12 <2,6,3,7>, <6,2,3,2>
-  3731926326U, // <7,6,2,4>: Cost 3 vsldoi4 <6,7,6,2>, RHS
+  2658184502U, // <7,6,2,4>: Cost 3 vsldoi4 <6,7,6,2>, RHS
   3852915176U, // <7,6,2,5>: Cost 4 vsldoi12 RHS, <6,2,5,3>
-  3731927941U, // <7,6,2,6>: Cost 3 vsldoi4 <6,7,6,2>, <6,7,6,2>
-  2779173370U, // <7,6,2,7>: Cost 2 vsldoi12 RHS, <6,2,7,3>
-  2779320835U, // <7,6,2,u>: Cost 2 vsldoi12 RHS, <6,2,u,3>
+  2658186117U, // <7,6,2,6>: Cost 3 vsldoi4 <6,7,6,2>, <6,7,6,2>
+  1705431546U, // <7,6,2,7>: Cost 2 vsldoi12 RHS, <6,2,7,3>
+  1705579011U, // <7,6,2,u>: Cost 2 vsldoi12 RHS, <6,2,u,3>
   3714015334U, // <7,6,3,0>: Cost 4 vsldoi4 <3,7,6,3>, LHS
   3777243425U, // <7,6,3,1>: Cost 4 vsldoi8 <3,1,7,6>, <3,1,7,6>
-  3393147781U, // <7,6,3,2>: Cost 3 vmrglw <6,2,7,3>, <6,7,6,2>
+  2319405957U, // <7,6,3,2>: Cost 3 vmrglw <6,2,7,3>, <6,7,6,2>
   3375229286U, // <7,6,3,3>: Cost 4 vmrglw <3,2,7,3>, <3,2,6,3>
-  3852915250U, // <7,6,3,4>: Cost 3 vsldoi12 RHS, <6,3,4,5>
+  2779173426U, // <7,6,3,4>: Cost 3 vsldoi12 RHS, <6,3,4,5>
   3375228721U, // <7,6,3,5>: Cost 4 vmrglw <3,2,7,3>, <2,4,6,5>
-  3393147704U, // <7,6,3,6>: Cost 3 vmrglw <6,2,7,3>, <6,6,6,6>
-  2319404342U, // <7,6,3,7>: Cost 2 vmrglw <6,2,7,3>, RHS
-  2319404343U, // <7,6,3,u>: Cost 2 vmrglw <6,2,7,3>, RHS
+  2319405880U, // <7,6,3,6>: Cost 3 vmrglw <6,2,7,3>, <6,6,6,6>
+  1245662518U, // <7,6,3,7>: Cost 2 vmrglw <6,2,7,3>, RHS
+  1245662519U, // <7,6,3,u>: Cost 2 vmrglw <6,2,7,3>, RHS
   3852915291U, // <7,6,4,0>: Cost 4 vsldoi12 RHS, <6,4,0,1>
   3389834729U, // <7,6,4,1>: Cost 4 vmrglw <5,6,7,4>, <2,0,6,1>
-  3333214714U, // <7,6,4,2>: Cost 3 vmrghw <7,4,5,6>, <6,2,7,3>
+  2259472890U, // <7,6,4,2>: Cost 3 vmrghw <7,4,5,6>, <6,2,7,3>
   3852915321U, // <7,6,4,3>: Cost 4 vsldoi12 RHS, <6,4,3,4>
   3852915330U, // <7,6,4,4>: Cost 4 vsldoi12 RHS, <6,4,4,4>
-  3852915341U, // <7,6,4,5>: Cost 3 vsldoi12 RHS, <6,4,5,6>
-  3389838136U, // <7,6,4,6>: Cost 3 vmrglw <5,6,7,4>, <6,6,6,6>
-  2316094774U, // <7,6,4,7>: Cost 2 vmrglw <5,6,7,4>, RHS
-  2316094775U, // <7,6,4,u>: Cost 2 vmrglw <5,6,7,4>, RHS
+  2779173517U, // <7,6,4,5>: Cost 3 vsldoi12 RHS, <6,4,5,6>
+  2316096312U, // <7,6,4,6>: Cost 3 vmrglw <5,6,7,4>, <6,6,6,6>
+  1242352950U, // <7,6,4,7>: Cost 2 vmrglw <5,6,7,4>, RHS
+  1242352951U, // <7,6,4,u>: Cost 2 vmrglw <5,6,7,4>, RHS
   3852915372U, // <7,6,5,0>: Cost 4 vsldoi12 RHS, <6,5,0,1>
   3835294392U, // <7,6,5,1>: Cost 5 vsldoi12 <1,6,1,7>, <6,5,1,4>
   3852915395U, // <7,6,5,2>: Cost 4 vsldoi12 RHS, <6,5,2,6>
   3852915404U, // <7,6,5,3>: Cost 4 vsldoi12 RHS, <6,5,3,6>
   3852915412U, // <7,6,5,4>: Cost 4 vsldoi12 RHS, <6,5,4,5>
   3377899313U, // <7,6,5,5>: Cost 4 vmrglw <3,6,7,5>, <2,4,6,5>
-  3792506984U, // <7,6,5,6>: Cost 3 vsldoi8 <5,6,7,6>, <5,6,7,6>
-  3852915435U, // <7,6,5,7>: Cost 3 vsldoi12 RHS, <6,5,7,1>
-  3853062900U, // <7,6,5,u>: Cost 3 vsldoi12 RHS, <6,5,u,1>
-  3731955814U, // <7,6,6,0>: Cost 3 vsldoi4 <6,7,6,6>, LHS
+  2718765160U, // <7,6,5,6>: Cost 3 vsldoi8 <5,6,7,6>, <5,6,7,6>
+  2779173611U, // <7,6,5,7>: Cost 3 vsldoi12 RHS, <6,5,7,1>
+  2779321076U, // <7,6,5,u>: Cost 3 vsldoi12 RHS, <6,5,u,1>
+  2658213990U, // <7,6,6,0>: Cost 3 vsldoi4 <6,7,6,6>, LHS
   3852915462U, // <7,6,6,1>: Cost 4 vsldoi12 RHS, <6,6,1,1>
-  3792507386U, // <7,6,6,2>: Cost 3 vsldoi8 <5,6,7,6>, <6,2,7,3>
+  2718765562U, // <7,6,6,2>: Cost 3 vsldoi8 <5,6,7,6>, <6,2,7,3>
   3714042622U, // <7,6,6,3>: Cost 4 vsldoi4 <3,7,6,6>, <3,7,6,6>
-  3731959094U, // <7,6,6,4>: Cost 3 vsldoi4 <6,7,6,6>, RHS
-  3797816048U, // <7,6,6,5>: Cost 3 vsldoi8 <6,5,7,6>, <6,5,7,6>
-  2779173688U, // <7,6,6,6>: Cost 2 vsldoi12 RHS, <6,6,6,6>
-  2779173698U, // <7,6,6,7>: Cost 2 vsldoi12 RHS, <6,6,7,7>
-  2779321163U, // <7,6,6,u>: Cost 2 vsldoi12 RHS, <6,6,u,7>
-  2779173710U, // <7,6,7,0>: Cost 2 vsldoi12 RHS, <6,7,0,1>
-  3852915543U, // <7,6,7,1>: Cost 3 vsldoi12 RHS, <6,7,1,1>
-  3852915553U, // <7,6,7,2>: Cost 3 vsldoi12 RHS, <6,7,2,2>
-  3852915560U, // <7,6,7,3>: Cost 3 vsldoi12 RHS, <6,7,3,0>
-  2779173750U, // <7,6,7,4>: Cost 2 vsldoi12 RHS, <6,7,4,5>
-  3852915583U, // <7,6,7,5>: Cost 3 vsldoi12 RHS, <6,7,5,5>
-  3852915589U, // <7,6,7,6>: Cost 3 vsldoi12 RHS, <6,7,6,2>
-  2322091318U, // <7,6,7,7>: Cost 2 vmrglw <6,6,7,7>, RHS
-  2779173782U, // <7,6,7,u>: Cost 2 vsldoi12 RHS, <6,7,u,1>
-  2779321247U, // <7,6,u,0>: Cost 2 vsldoi12 RHS, <6,u,0,1>
-  3852915625U, // <7,6,u,1>: Cost 3 vsldoi12 RHS, <6,u,1,2>
-  3853063090U, // <7,6,u,2>: Cost 3 vsldoi12 RHS, <6,u,2,2>
-  3853063097U, // <7,6,u,3>: Cost 3 vsldoi12 RHS, <6,u,3,0>
-  2779321287U, // <7,6,u,4>: Cost 2 vsldoi12 RHS, <6,u,4,5>
-  3852915665U, // <7,6,u,5>: Cost 3 vsldoi12 RHS, <6,u,5,6>
-  2779173688U, // <7,6,u,6>: Cost 2 vsldoi12 RHS, <6,6,6,6>
-  2779173856U, // <7,6,u,7>: Cost 2 vsldoi12 RHS, <6,u,7,3>
-  2779321319U, // <7,6,u,u>: Cost 2 vsldoi12 RHS, <6,u,u,1>
-  2316062818U, // <7,7,0,0>: Cost 2 vmrglw <5,6,7,0>, <5,6,7,0>
-  2779173882U, // <7,7,0,1>: Cost 2 vsldoi12 RHS, <7,0,1,2>
+  2658217270U, // <7,6,6,4>: Cost 3 vsldoi4 <6,7,6,6>, RHS
+  2724074224U, // <7,6,6,5>: Cost 3 vsldoi8 <6,5,7,6>, <6,5,7,6>
+  1705431864U, // <7,6,6,6>: Cost 2 vsldoi12 RHS, <6,6,6,6>
+  1705431874U, // <7,6,6,7>: Cost 2 vsldoi12 RHS, <6,6,7,7>
+  1705579339U, // <7,6,6,u>: Cost 2 vsldoi12 RHS, <6,6,u,7>
+  1705431886U, // <7,6,7,0>: Cost 2 vsldoi12 RHS, <6,7,0,1>
+  2779173719U, // <7,6,7,1>: Cost 3 vsldoi12 RHS, <6,7,1,1>
+  2779173729U, // <7,6,7,2>: Cost 3 vsldoi12 RHS, <6,7,2,2>
+  2779173736U, // <7,6,7,3>: Cost 3 vsldoi12 RHS, <6,7,3,0>
+  1705431926U, // <7,6,7,4>: Cost 2 vsldoi12 RHS, <6,7,4,5>
+  2779173759U, // <7,6,7,5>: Cost 3 vsldoi12 RHS, <6,7,5,5>
+  2779173765U, // <7,6,7,6>: Cost 3 vsldoi12 RHS, <6,7,6,2>
+  1248349494U, // <7,6,7,7>: Cost 2 vmrglw <6,6,7,7>, RHS
+  1705431958U, // <7,6,7,u>: Cost 2 vsldoi12 RHS, <6,7,u,1>
+  1705579423U, // <7,6,u,0>: Cost 2 vsldoi12 RHS, <6,u,0,1>
+  2779173801U, // <7,6,u,1>: Cost 3 vsldoi12 RHS, <6,u,1,2>
+  2779321266U, // <7,6,u,2>: Cost 3 vsldoi12 RHS, <6,u,2,2>
+  2779321273U, // <7,6,u,3>: Cost 3 vsldoi12 RHS, <6,u,3,0>
+  1705579463U, // <7,6,u,4>: Cost 2 vsldoi12 RHS, <6,u,4,5>
+  2779173841U, // <7,6,u,5>: Cost 3 vsldoi12 RHS, <6,u,5,6>
+  1705431864U, // <7,6,u,6>: Cost 2 vsldoi12 RHS, <6,6,6,6>
+  1705432032U, // <7,6,u,7>: Cost 2 vsldoi12 RHS, <6,u,7,3>
+  1705579495U, // <7,6,u,u>: Cost 2 vsldoi12 RHS, <6,u,u,1>
+  1242320994U, // <7,7,0,0>: Cost 2 vmrglw <5,6,7,0>, <5,6,7,0>
+  1705432058U, // <7,7,0,1>: Cost 2 vsldoi12 RHS, <7,0,1,2>
   3841414146U, // <7,7,0,2>: Cost 4 vsldoi12 <2,6,3,7>, <7,0,2,1>
-  3389805050U, // <7,7,0,3>: Cost 3 vmrglw <5,6,7,0>, <6,2,7,3>
-  3852915732U, // <7,7,0,4>: Cost 3 vsldoi12 RHS, <7,0,4,1>
-  3731984482U, // <7,7,0,5>: Cost 3 vsldoi4 <6,7,7,0>, <5,6,7,0>
-  3731985292U, // <7,7,0,6>: Cost 3 vsldoi4 <6,7,7,0>, <6,7,7,0>
-  3389805378U, // <7,7,0,7>: Cost 3 vmrglw <5,6,7,0>, <6,6,7,7>
-  2779173945U, // <7,7,0,u>: Cost 2 vsldoi12 RHS, <7,0,u,2>
+  2316063226U, // <7,7,0,3>: Cost 3 vmrglw <5,6,7,0>, <6,2,7,3>
+  2779173908U, // <7,7,0,4>: Cost 3 vsldoi12 RHS, <7,0,4,1>
+  2658242658U, // <7,7,0,5>: Cost 3 vsldoi4 <6,7,7,0>, <5,6,7,0>
+  2658243468U, // <7,7,0,6>: Cost 3 vsldoi4 <6,7,7,0>, <6,7,7,0>
+  2316063554U, // <7,7,0,7>: Cost 3 vmrglw <5,6,7,0>, <6,6,7,7>
+  1705432121U, // <7,7,0,u>: Cost 2 vsldoi12 RHS, <7,0,u,2>
   3852915777U, // <7,7,1,0>: Cost 4 vsldoi12 RHS, <7,1,0,1>
-  3852915786U, // <7,7,1,1>: Cost 3 vsldoi12 RHS, <7,1,1,1>
-  3852915797U, // <7,7,1,2>: Cost 3 vsldoi12 RHS, <7,1,2,3>
+  2779173962U, // <7,7,1,1>: Cost 3 vsldoi12 RHS, <7,1,1,1>
+  2779173973U, // <7,7,1,2>: Cost 3 vsldoi12 RHS, <7,1,2,3>
   3389813242U, // <7,7,1,3>: Cost 4 vmrglw <5,6,7,1>, <6,2,7,3>
   3852915813U, // <7,7,1,4>: Cost 4 vsldoi12 RHS, <7,1,4,1>
   3852915821U, // <7,7,1,5>: Cost 4 vsldoi12 RHS, <7,1,5,0>
   3835294839U, // <7,7,1,6>: Cost 4 vsldoi12 <1,6,1,7>, <7,1,6,1>
-  3403085420U, // <7,7,1,7>: Cost 3 vmrglw <7,u,7,1>, <7,7,7,7>
-  3852915851U, // <7,7,1,u>: Cost 3 vsldoi12 RHS, <7,1,u,3>
-  3876803732U, // <7,7,2,0>: Cost 3 vsldoi12 RHS, <7,2,0,3>
+  2329343596U, // <7,7,1,7>: Cost 3 vmrglw <7,u,7,1>, <7,7,7,7>
+  2779174027U, // <7,7,1,u>: Cost 3 vsldoi12 RHS, <7,1,u,3>
+  2803061908U, // <7,7,2,0>: Cost 3 vsldoi12 RHS, <7,2,0,3>
   3852915869U, // <7,7,2,1>: Cost 4 vsldoi12 RHS, <7,2,1,3>
-  3852915877U, // <7,7,2,2>: Cost 3 vsldoi12 RHS, <7,2,2,2>
-  3852915884U, // <7,7,2,3>: Cost 3 vsldoi12 RHS, <7,2,3,0>
-  3876803768U, // <7,7,2,4>: Cost 3 vsldoi12 RHS, <7,2,4,3>
+  2779174053U, // <7,7,2,2>: Cost 3 vsldoi12 RHS, <7,2,2,2>
+  2779174060U, // <7,7,2,3>: Cost 3 vsldoi12 RHS, <7,2,3,0>
+  2803061944U, // <7,7,2,4>: Cost 3 vsldoi12 RHS, <7,2,4,3>
   3852915905U, // <7,7,2,5>: Cost 4 vsldoi12 RHS, <7,2,5,3>
-  3841414346U, // <7,7,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <7,2,6,3>
-  3865597139U, // <7,7,2,7>: Cost 3 vsldoi12 <6,6,7,7>, <7,2,7,3>
-  3842741468U, // <7,7,2,u>: Cost 3 vsldoi12 <2,u,3,7>, <7,2,u,3>
-  3852915939U, // <7,7,3,0>: Cost 3 vsldoi12 RHS, <7,3,0,1>
+  2767672522U, // <7,7,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <7,2,6,3>
+  2791855315U, // <7,7,2,7>: Cost 3 vsldoi12 <6,6,7,7>, <7,2,7,3>
+  2768999644U, // <7,7,2,u>: Cost 3 vsldoi12 <2,u,3,7>, <7,2,u,3>
+  2779174115U, // <7,7,3,0>: Cost 3 vsldoi12 RHS, <7,3,0,1>
   3852915948U, // <7,7,3,1>: Cost 4 vsldoi12 RHS, <7,3,1,1>
   3841414394U, // <7,7,3,2>: Cost 4 vsldoi12 <2,6,3,7>, <7,3,2,6>
-  2319405562U, // <7,7,3,3>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
-  3852915979U, // <7,7,3,4>: Cost 3 vsldoi12 RHS, <7,3,4,5>
+  1245663738U, // <7,7,3,3>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
+  2779174155U, // <7,7,3,4>: Cost 3 vsldoi12 RHS, <7,3,4,5>
   3852915988U, // <7,7,3,5>: Cost 4 vsldoi12 RHS, <7,3,5,5>
-  3780569783U, // <7,7,3,6>: Cost 3 vsldoi8 <3,6,7,7>, <3,6,7,7>
-  3393147714U, // <7,7,3,7>: Cost 3 vmrglw <6,2,7,3>, <6,6,7,7>
-  2319405562U, // <7,7,3,u>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
-  3852916024U, // <7,7,4,0>: Cost 3 vsldoi12 RHS, <7,4,0,5>
+  2706827959U, // <7,7,3,6>: Cost 3 vsldoi8 <3,6,7,7>, <3,6,7,7>
+  2319405890U, // <7,7,3,7>: Cost 3 vmrglw <6,2,7,3>, <6,6,7,7>
+  1245663738U, // <7,7,3,u>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
+  2779174200U, // <7,7,4,0>: Cost 3 vsldoi12 RHS, <7,4,0,5>
   3852916030U, // <7,7,4,1>: Cost 4 vsldoi12 RHS, <7,4,1,2>
   3714099130U, // <7,7,4,2>: Cost 4 vsldoi4 <3,7,7,4>, <2,6,3,7>
-  3389837818U, // <7,7,4,3>: Cost 3 vmrglw <5,6,7,4>, <6,2,7,3>
-  2316095590U, // <7,7,4,4>: Cost 2 vmrglw <5,6,7,4>, <5,6,7,4>
-  2779174246U, // <7,7,4,5>: Cost 2 vsldoi12 RHS, <7,4,5,6>
-  3732018064U, // <7,7,4,6>: Cost 3 vsldoi4 <6,7,7,4>, <6,7,7,4>
-  3389838146U, // <7,7,4,7>: Cost 3 vmrglw <5,6,7,4>, <6,6,7,7>
-  2779174273U, // <7,7,4,u>: Cost 2 vsldoi12 RHS, <7,4,u,6>
+  2316095994U, // <7,7,4,3>: Cost 3 vmrglw <5,6,7,4>, <6,2,7,3>
+  1242353766U, // <7,7,4,4>: Cost 2 vmrglw <5,6,7,4>, <5,6,7,4>
+  1705432422U, // <7,7,4,5>: Cost 2 vsldoi12 RHS, <7,4,5,6>
+  2658276240U, // <7,7,4,6>: Cost 3 vsldoi4 <6,7,7,4>, <6,7,7,4>
+  2316096322U, // <7,7,4,7>: Cost 3 vmrglw <5,6,7,4>, <6,6,7,7>
+  1705432449U, // <7,7,4,u>: Cost 2 vsldoi12 RHS, <7,4,u,6>
   3852916101U, // <7,7,5,0>: Cost 4 vsldoi12 RHS, <7,5,0,1>
   3854906765U, // <7,7,5,1>: Cost 4 vsldoi12 RHS, <7,5,1,0>
   3852916121U, // <7,7,5,2>: Cost 4 vsldoi12 RHS, <7,5,2,3>
   3389846010U, // <7,7,5,3>: Cost 4 vmrglw <5,6,7,5>, <6,2,7,3>
   3852916141U, // <7,7,5,4>: Cost 4 vsldoi12 RHS, <7,5,4,5>
-  3852916150U, // <7,7,5,5>: Cost 3 vsldoi12 RHS, <7,5,5,5>
-  3852916161U, // <7,7,5,6>: Cost 3 vsldoi12 RHS, <7,5,6,7>
-  3403118188U, // <7,7,5,7>: Cost 3 vmrglw <7,u,7,5>, <7,7,7,7>
-  3853063635U, // <7,7,5,u>: Cost 3 vsldoi12 RHS, <7,5,u,7>
-  3732029542U, // <7,7,6,0>: Cost 3 vsldoi4 <6,7,7,6>, LHS
+  2779174326U, // <7,7,5,5>: Cost 3 vsldoi12 RHS, <7,5,5,5>
+  2779174337U, // <7,7,5,6>: Cost 3 vsldoi12 RHS, <7,5,6,7>
+  2329376364U, // <7,7,5,7>: Cost 3 vmrglw <7,u,7,5>, <7,7,7,7>
+  2779321811U, // <7,7,5,u>: Cost 3 vsldoi12 RHS, <7,5,u,7>
+  2658287718U, // <7,7,6,0>: Cost 3 vsldoi4 <6,7,7,6>, LHS
   3852916197U, // <7,7,6,1>: Cost 4 vsldoi12 RHS, <7,6,1,7>
-  3852916206U, // <7,7,6,2>: Cost 3 vsldoi12 RHS, <7,6,2,7>
-  3389854202U, // <7,7,6,3>: Cost 3 vmrglw <5,6,7,6>, <6,2,7,3>
-  3732032822U, // <7,7,6,4>: Cost 3 vsldoi4 <6,7,7,6>, RHS
+  2779174382U, // <7,7,6,2>: Cost 3 vsldoi12 RHS, <7,6,2,7>
+  2316112378U, // <7,7,6,3>: Cost 3 vmrglw <5,6,7,6>, <6,2,7,3>
+  2658290998U, // <7,7,6,4>: Cost 3 vsldoi4 <6,7,7,6>, RHS
   3852916233U, // <7,7,6,5>: Cost 4 vsldoi12 RHS, <7,6,5,7>
-  2724746050U, // <7,7,6,6>: Cost 2 vsldoi8 <6,6,7,7>, <6,6,7,7>
-  3852916244U, // <7,7,6,7>: Cost 3 vsldoi12 RHS, <7,6,7,0>
-  2726073316U, // <7,7,6,u>: Cost 2 vsldoi8 <6,u,7,7>, <6,u,7,7>
-  2664267878U, // <7,7,7,0>: Cost 2 vsldoi4 <7,7,7,7>, LHS
-  3402470447U, // <7,7,7,1>: Cost 3 vmrglw <7,7,7,7>, <7,0,7,1>
-  3798488275U, // <7,7,7,2>: Cost 3 vsldoi8 <6,6,7,7>, <7,2,7,3>
-  3395834362U, // <7,7,7,3>: Cost 3 vmrglw <6,6,7,7>, <6,2,7,3>
-  2664271158U, // <7,7,7,4>: Cost 2 vsldoi4 <7,7,7,7>, RHS
-  3402470775U, // <7,7,7,5>: Cost 3 vmrglw <7,7,7,7>, <7,4,7,5>
-  3798488594U, // <7,7,7,6>: Cost 3 vsldoi8 <6,6,7,7>, <7,6,6,7>
-  1504103734U, // <7,7,7,7>: Cost 1 vspltisw3 RHS
-  1504103734U, // <7,7,7,u>: Cost 1 vspltisw3 RHS
-  2316062818U, // <7,7,u,0>: Cost 2 vmrglw <5,6,7,0>, <5,6,7,0>
-  2779321986U, // <7,7,u,1>: Cost 2 vsldoi12 RHS, <7,u,1,2>
-  3853063820U, // <7,7,u,2>: Cost 3 vsldoi12 RHS, <7,u,2,3>
-  2319405562U, // <7,7,u,3>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
-  2316095590U, // <7,7,u,4>: Cost 2 vmrglw <5,6,7,4>, <5,6,7,4>
-  2779322026U, // <7,7,u,5>: Cost 2 vsldoi12 RHS, <7,u,5,6>
-  2736691444U, // <7,7,u,6>: Cost 2 vsldoi8 <u,6,7,7>, <u,6,7,7>
-  1504103734U, // <7,7,u,7>: Cost 1 vspltisw3 RHS
-  1504103734U, // <7,7,u,u>: Cost 1 vspltisw3 RHS
-  2779168768U, // <7,u,0,0>: Cost 2 vsldoi12 RHS, <0,0,0,0>
-  2779174611U, // <7,u,0,1>: Cost 2 vsldoi12 RHS, <u,0,1,2>
-  3389802709U, // <7,u,0,2>: Cost 3 vmrglw <5,6,7,0>, <3,0,u,2>
-  2316058780U, // <7,u,0,3>: Cost 2 vmrglw <5,6,7,0>, LHS
-  3852916461U, // <7,u,0,4>: Cost 3 vsldoi12 RHS, <u,0,4,1>
-  2256492698U, // <7,u,0,5>: Cost 2 vmrghw <7,0,1,2>, RHS
-  3389803037U, // <7,u,0,6>: Cost 3 vmrglw <5,6,7,0>, <3,4,u,6>
-  2316062024U, // <7,u,0,7>: Cost 2 vmrglw <5,6,7,0>, RHS
-  2779174674U, // <7,u,0,u>: Cost 2 vsldoi12 RHS, <u,0,u,2>
-  2658320486U, // <7,u,1,0>: Cost 2 vsldoi4 <6,7,u,1>, LHS
-  2779169588U, // <7,u,1,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
-  1705432878U, // <7,u,1,2>: Cost 1 vsldoi12 RHS, LHS
-  3714149131U, // <7,u,1,3>: Cost 3 vsldoi4 <3,7,u,1>, <3,7,u,1>
-  2658323766U, // <7,u,1,4>: Cost 2 vsldoi4 <6,7,u,1>, RHS
-  3852916550U, // <7,u,1,5>: Cost 3 vsldoi12 RHS, <u,1,5,0>
-  2658325398U, // <7,u,1,6>: Cost 2 vsldoi4 <6,7,u,1>, <6,7,u,1>
-  3853064025U, // <7,u,1,7>: Cost 3 vsldoi12 RHS, <u,1,7,1>
-  1705432932U, // <7,u,1,u>: Cost 1 vsldoi12 RHS, LHS
-  3852916587U, // <7,u,2,0>: Cost 3 vsldoi12 RHS, <u,2,0,1>
-  3852916598U, // <7,u,2,1>: Cost 3 vsldoi12 RHS, <u,2,1,3>
-  2779170408U, // <7,u,2,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
-  2779174789U, // <7,u,2,3>: Cost 2 vsldoi12 RHS, <u,2,3,0>
-  3852916625U, // <7,u,2,4>: Cost 3 vsldoi12 RHS, <u,2,4,3>
-  3852916634U, // <7,u,2,5>: Cost 3 vsldoi12 RHS, <u,2,5,3>
-  3841415075U, // <7,u,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <u,2,6,3>
-  2779322284U, // <7,u,2,7>: Cost 2 vsldoi12 RHS, <u,2,7,3>
-  2779174834U, // <7,u,2,u>: Cost 2 vsldoi12 RHS, <u,2,u,0>
-  2779174844U, // <7,u,3,0>: Cost 2 vsldoi12 RHS, <u,3,0,1>
-  3852916677U, // <7,u,3,1>: Cost 3 vsldoi12 RHS, <u,3,1,1>
-  3841415123U, // <7,u,3,2>: Cost 3 vsldoi12 <2,6,3,7>, <u,3,2,6>
-  2319401116U, // <7,u,3,3>: Cost 2 vmrglw <6,2,7,3>, LHS
-  2779174884U, // <7,u,3,4>: Cost 2 vsldoi12 RHS, <u,3,4,5>
-  3852916717U, // <7,u,3,5>: Cost 3 vsldoi12 RHS, <u,3,5,5>
-  3780577976U, // <7,u,3,6>: Cost 3 vsldoi8 <3,6,7,u>, <3,6,7,u>
-  2319404360U, // <7,u,3,7>: Cost 2 vmrglw <6,2,7,3>, RHS
-  2779174916U, // <7,u,3,u>: Cost 2 vsldoi12 RHS, <u,3,u,1>
-  3852916749U, // <7,u,4,0>: Cost 3 vsldoi12 RHS, <u,4,0,1>
-  2259474222U, // <7,u,4,1>: Cost 2 vmrghw <7,4,5,6>, LHS
-  3389835477U, // <7,u,4,2>: Cost 3 vmrglw <5,6,7,4>, <3,0,u,2>
-  2316091548U, // <7,u,4,3>: Cost 2 vmrglw <5,6,7,4>, LHS
-  2779172048U, // <7,u,4,4>: Cost 2 vsldoi12 RHS, <4,4,4,4>
-  2779174975U, // <7,u,4,5>: Cost 2 vsldoi12 RHS, <u,4,5,6>
-  3389835805U, // <7,u,4,6>: Cost 3 vmrglw <5,6,7,4>, <3,4,u,6>
-  2316094792U, // <7,u,4,7>: Cost 2 vmrglw <5,6,7,4>, RHS
-  2779175002U, // <7,u,4,u>: Cost 2 vsldoi12 RHS, <u,4,u,6>
-  2658353254U, // <7,u,5,0>: Cost 2 vsldoi4 <6,7,u,5>, LHS
-  3854907494U, // <7,u,5,1>: Cost 3 vsldoi12 RHS, <u,5,1,0>
-  3714181050U, // <7,u,5,2>: Cost 3 vsldoi4 <3,7,u,5>, <2,6,3,7>
-  3714181903U, // <7,u,5,3>: Cost 3 vsldoi4 <3,7,u,5>, <3,7,u,5>
-  2658356534U, // <7,u,5,4>: Cost 2 vsldoi4 <6,7,u,5>, RHS
-  2779172868U, // <7,u,5,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
-  1705433242U, // <7,u,5,6>: Cost 1 vsldoi12 RHS, RHS
-  3853064349U, // <7,u,5,7>: Cost 3 vsldoi12 RHS, <u,5,7,1>
-  1705433260U, // <7,u,5,u>: Cost 1 vsldoi12 RHS, RHS
-  3852916911U, // <7,u,6,0>: Cost 3 vsldoi12 RHS, <u,6,0,1>
-  3852916926U, // <7,u,6,1>: Cost 3 vsldoi12 RHS, <u,6,1,7>
-  2722099711U, // <7,u,6,2>: Cost 2 vsldoi8 <6,2,7,u>, <6,2,7,u>
-  2779175120U, // <7,u,6,3>: Cost 2 vsldoi12 RHS, <u,6,3,7>
-  3852916951U, // <7,u,6,4>: Cost 3 vsldoi12 RHS, <u,6,4,5>
-  3852916962U, // <7,u,6,5>: Cost 3 vsldoi12 RHS, <u,6,5,7>
-  2724754243U, // <7,u,6,6>: Cost 2 vsldoi8 <6,6,7,u>, <6,6,7,u>
-  2779322612U, // <7,u,6,7>: Cost 2 vsldoi12 RHS, <u,6,7,7>
-  2779175165U, // <7,u,6,u>: Cost 2 vsldoi12 RHS, <u,6,u,7>
-  2779322624U, // <7,u,7,0>: Cost 2 vsldoi12 RHS, <u,7,0,1>
-  2261620526U, // <7,u,7,1>: Cost 2 vmrghw <7,7,7,7>, LHS
-  3841784087U, // <7,u,7,2>: Cost 3 vsldoi12 <2,6,u,7>, <u,7,2,6>
-  2322088092U, // <7,u,7,3>: Cost 2 vmrglw <6,6,7,7>, LHS
-  2779322664U, // <7,u,7,4>: Cost 2 vsldoi12 RHS, <u,7,4,5>
-  2261620890U, // <7,u,7,5>: Cost 2 vmrghw <7,7,7,7>, RHS
-  3853064503U, // <7,u,7,6>: Cost 3 vsldoi12 RHS, <u,7,6,2>
-  1504103734U, // <7,u,7,7>: Cost 1 vspltisw3 RHS
-  1504103734U, // <7,u,7,u>: Cost 1 vspltisw3 RHS
-  2779175249U, // <7,u,u,0>: Cost 2 vsldoi12 RHS, <u,u,0,1>
-  2779175259U, // <7,u,u,1>: Cost 2 vsldoi12 RHS, <u,u,1,2>
-  1705433445U, // <7,u,u,2>: Cost 1 vsldoi12 RHS, LHS
-  2779175275U, // <7,u,u,3>: Cost 2 vsldoi12 RHS, <u,u,3,0>
-  2779175289U, // <7,u,u,4>: Cost 2 vsldoi12 RHS, <u,u,4,5>
-  2779175299U, // <7,u,u,5>: Cost 2 vsldoi12 RHS, <u,u,5,6>
-  1705433485U, // <7,u,u,6>: Cost 1 vsldoi12 RHS, RHS
-  1504103734U, // <7,u,u,7>: Cost 1 vspltisw3 RHS
-  1705433499U, // <7,u,u,u>: Cost 1 vsldoi12 RHS, LHS
-  1275904102U, // <u,0,0,0>: Cost 1 vspltisw0 LHS
-  2752339978U, // <u,0,0,1>: Cost 2 vsldoi12 LHS, <0,0,1,1>
-  3708241978U, // <u,0,0,2>: Cost 3 vsldoi4 <2,u,0,0>, <2,u,0,0>
-  3363338093U, // <u,0,0,3>: Cost 3 vmrglw <1,2,u,0>, <u,2,0,3>
-  2622557494U, // <u,0,0,4>: Cost 2 vsldoi4 <0,u,0,0>, RHS
-  3737440354U, // <u,0,0,5>: Cost 3 vsldoi4 <7,7,0,0>, <5,6,7,0>
-  3732132766U, // <u,0,0,6>: Cost 3 vsldoi4 <6,u,0,0>, <6,u,0,0>
-  3363338421U, // <u,0,0,7>: Cost 3 vmrglw <1,2,u,0>, <u,6,0,7>
-  1275904102U, // <u,0,0,u>: Cost 1 vspltisw0 LHS
-  2634506342U, // <u,0,1,0>: Cost 2 vsldoi4 <2,u,0,1>, LHS
-  1189462118U, // <u,0,1,1>: Cost 1 vmrghw LHS, LHS
-  1678598251U, // <u,0,1,2>: Cost 1 vsldoi12 LHS, LHS
-  3708250262U, // <u,0,1,3>: Cost 3 vsldoi4 <2,u,0,1>, <3,0,1,2>
-  2634509622U, // <u,0,1,4>: Cost 2 vsldoi4 <2,u,0,1>, RHS
-  3726168262U, // <u,0,1,5>: Cost 3 vsldoi4 <5,u,0,1>, <5,u,0,1>
-  2658399135U, // <u,0,1,6>: Cost 2 vsldoi4 <6,u,0,1>, <6,u,0,1>
-  3732141050U, // <u,0,1,7>: Cost 3 vsldoi4 <6,u,0,1>, <7,0,1,2>
-  1678598300U, // <u,0,1,u>: Cost 1 vsldoi12 LHS, LHS
-  3770631674U, // <u,0,2,0>: Cost 3 vsldoi8 <2,0,u,0>, <2,0,u,0>
-  2263916646U, // <u,0,2,1>: Cost 2 vmrghw <u,2,3,0>, LHS
-  3765986920U, // <u,0,2,2>: Cost 3 vsldoi8 <1,2,u,0>, <2,2,2,2>
-  3765986982U, // <u,0,2,3>: Cost 3 vsldoi8 <1,2,u,0>, <2,3,0,1>
-  3337658706U, // <u,0,2,4>: Cost 3 vmrghw <u,2,3,0>, <0,4,1,5>
-  3373451732U, // <u,0,2,5>: Cost 3 vmrglw <3,0,1,2>, <3,4,0,5>
-  3765987258U, // <u,0,2,6>: Cost 3 vsldoi8 <1,2,u,0>, <2,6,3,7>
-  3775277105U, // <u,0,2,7>: Cost 3 vsldoi8 <2,7,u,0>, <2,7,u,0>
-  2263917213U, // <u,0,2,u>: Cost 2 vmrghw <u,2,3,0>, LHS
-  2282979328U, // <u,0,3,0>: Cost 2 vmrglw LHS, <0,0,0,0>
-  2282981030U, // <u,0,3,1>: Cost 2 vmrglw LHS, <2,3,0,1>
-  3777931637U, // <u,0,3,2>: Cost 3 vsldoi8 <3,2,u,0>, <3,2,u,0>
-  3765987740U, // <u,0,3,3>: Cost 3 vsldoi8 <1,2,u,0>, <3,3,3,3>
-  3356722857U, // <u,0,3,4>: Cost 3 vmrglw LHS, <2,3,0,4>
-  3738128482U, // <u,0,3,5>: Cost 3 vsldoi4 <7,u,0,3>, <5,6,7,0>
-  3765619320U, // <u,0,3,6>: Cost 3 vsldoi8 <1,2,3,0>, <3,6,0,7>
-  3738130042U, // <u,0,3,7>: Cost 3 vsldoi4 <7,u,0,3>, <7,u,0,3>
-  2282981037U, // <u,0,3,u>: Cost 2 vmrglw LHS, <2,3,0,u>
-  3363364864U, // <u,0,4,0>: Cost 3 vmrglw <1,2,u,4>, <0,0,0,0>
-  2752340306U, // <u,0,4,1>: Cost 2 vsldoi12 LHS, <0,4,1,5>
-  3708274750U, // <u,0,4,2>: Cost 3 vsldoi4 <2,u,0,4>, <2,u,0,4>
-  3309322496U, // <u,0,4,3>: Cost 3 vmrghw <3,4,5,6>, <0,3,1,4>
-  2217361746U, // <u,0,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
-  2692246838U, // <u,0,4,5>: Cost 2 vsldoi8 <1,2,u,0>, RHS
-  3732165538U, // <u,0,4,6>: Cost 3 vsldoi4 <6,u,0,4>, <6,u,0,4>
-  3787001288U, // <u,0,4,7>: Cost 3 vsldoi8 <4,7,5,0>, <4,7,5,0>
-  2756985233U, // <u,0,4,u>: Cost 2 vsldoi12 LHS, <0,4,u,5>
-  2266185728U, // <u,0,5,0>: Cost 2 vmrghw RHS, <0,0,0,0>
-  1192444006U, // <u,0,5,1>: Cost 1 vmrghw RHS, LHS
-  3339927725U, // <u,0,5,2>: Cost 3 vmrghw RHS, <0,2,1,2>
-  3714255640U, // <u,0,5,3>: Cost 3 vsldoi4 <3,u,0,5>, <3,u,0,5>
-  2266186066U, // <u,0,5,4>: Cost 2 vmrghw RHS, <0,4,1,5>
-  3792531460U, // <u,0,5,5>: Cost 3 vsldoi8 <5,6,u,0>, <5,5,5,5>
-  2718789739U, // <u,0,5,6>: Cost 2 vsldoi8 <5,6,u,0>, <5,6,u,0>
-  3738146428U, // <u,0,5,7>: Cost 3 vsldoi4 <7,u,0,5>, <7,u,0,5>
-  1192444573U, // <u,0,5,u>: Cost 1 vmrghw RHS, LHS
-  3376652288U, // <u,0,6,0>: Cost 3 vmrglw <3,4,u,6>, <0,0,0,0>
-  2266628198U, // <u,0,6,1>: Cost 2 vmrghw <u,6,3,7>, LHS
-  3792531962U, // <u,0,6,2>: Cost 3 vsldoi8 <5,6,u,0>, <6,2,7,3>
-  3796513361U, // <u,0,6,3>: Cost 3 vsldoi8 <6,3,u,0>, <6,3,u,0>
-  3340370258U, // <u,0,6,4>: Cost 3 vmrghw <u,6,3,7>, <0,4,1,5>
-  3322692004U, // <u,0,6,5>: Cost 3 vmrghw <5,6,7,0>, <0,5,1,6>
-  3792532280U, // <u,0,6,6>: Cost 3 vsldoi8 <5,6,u,0>, <6,6,6,6>
-  3792532302U, // <u,0,6,7>: Cost 3 vsldoi8 <5,6,u,0>, <6,7,0,1>
-  2266628765U, // <u,0,6,u>: Cost 2 vmrghw <u,6,3,7>, LHS
-  2309554176U, // <u,0,7,0>: Cost 2 vmrglw RHS, <0,0,0,0>
-  2309555878U, // <u,0,7,1>: Cost 2 vmrglw RHS, <2,3,0,1>
-  3801822425U, // <u,0,7,2>: Cost 3 vsldoi8 <7,2,u,0>, <7,2,u,0>
-  3714272026U, // <u,0,7,3>: Cost 3 vsldoi4 <3,u,0,7>, <3,u,0,7>
-  3714272566U, // <u,0,7,4>: Cost 3 vsldoi4 <3,u,0,7>, RHS
-  3383298516U, // <u,0,7,5>: Cost 3 vmrglw RHS, <3,4,0,5>
-  3804476957U, // <u,0,7,6>: Cost 3 vsldoi8 <7,6,u,0>, <7,6,u,0>
-  3383298680U, // <u,0,7,7>: Cost 3 vmrglw RHS, <3,6,0,7>
-  2309555885U, // <u,0,7,u>: Cost 2 vmrglw RHS, <2,3,0,u>
-  1275904102U, // <u,0,u,0>: Cost 1 vspltisw0 LHS
-  1194106982U, // <u,0,u,1>: Cost 1 vmrghw LHS, LHS
-  1678598813U, // <u,0,u,2>: Cost 1 vsldoi12 LHS, LHS
-  3765991356U, // <u,0,u,3>: Cost 3 vsldoi8 <1,2,u,0>, <u,3,0,1>
-  2634566966U, // <u,0,u,4>: Cost 2 vsldoi4 <2,u,0,u>, RHS
-  2692249754U, // <u,0,u,5>: Cost 2 vsldoi8 <1,2,u,0>, RHS
-  2658456486U, // <u,0,u,6>: Cost 2 vsldoi4 <6,u,0,u>, <6,u,0,u>
-  3383306872U, // <u,0,u,7>: Cost 3 vmrglw RHS, <3,6,0,7>
-  1678598867U, // <u,0,u,u>: Cost 1 vsldoi12 LHS, LHS
-  2684952649U, // <u,1,0,0>: Cost 2 vsldoi8 <0,0,u,1>, <0,0,u,1>
-  2690261094U, // <u,1,0,1>: Cost 2 vsldoi8 <0,u,u,1>, LHS
-  3361347283U, // <u,1,0,2>: Cost 3 vmrglw <0,u,u,0>, <u,0,1,2>
-  3714288412U, // <u,1,0,3>: Cost 3 vsldoi4 <3,u,1,0>, <3,u,1,0>
-  3696373046U, // <u,1,0,4>: Cost 3 vsldoi4 <0,u,1,0>, RHS
-  3363332434U, // <u,1,0,5>: Cost 3 vmrglw <1,2,u,0>, <0,4,1,5>
-  3738178454U, // <u,1,0,6>: Cost 3 vsldoi4 <7,u,1,0>, <6,7,u,1>
-  3738179200U, // <u,1,0,7>: Cost 3 vsldoi4 <7,u,1,0>, <7,u,1,0>
-  2690261713U, // <u,1,0,u>: Cost 2 vsldoi8 <0,u,u,1>, <0,u,u,1>
-  2622636690U, // <u,1,1,0>: Cost 2 vsldoi4 <0,u,1,1>, <0,u,1,1>
-  1343012966U, // <u,1,1,1>: Cost 1 vspltisw1 LHS
-  2263204758U, // <u,1,1,2>: Cost 2 vmrghw LHS, <1,2,3,0>
-  3696380054U, // <u,1,1,3>: Cost 3 vsldoi4 <0,u,1,1>, <3,0,1,2>
-  2622639414U, // <u,1,1,4>: Cost 2 vsldoi4 <0,u,1,1>, RHS
-  3830727516U, // <u,1,1,5>: Cost 3 vsldoi12 LHS, <1,1,5,5>
-  3732214696U, // <u,1,1,6>: Cost 3 vsldoi4 <6,u,1,1>, <6,u,1,1>
-  3361355966U, // <u,1,1,7>: Cost 3 vmrglw <0,u,u,1>, <u,6,1,7>
-  1343012966U, // <u,1,1,u>: Cost 1 vspltisw1 LHS
-  2640560230U, // <u,1,2,0>: Cost 2 vsldoi4 <3,u,1,2>, LHS
-  3830727559U, // <u,1,2,1>: Cost 3 vsldoi12 LHS, <1,2,1,3>
-  2222113686U, // <u,1,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
+  1651004226U, // <7,7,6,6>: Cost 2 vsldoi8 <6,6,7,7>, <6,6,7,7>
+  2779174420U, // <7,7,6,7>: Cost 3 vsldoi12 RHS, <7,6,7,0>
+  1652331492U, // <7,7,6,u>: Cost 2 vsldoi8 <6,u,7,7>, <6,u,7,7>
+  1590526054U, // <7,7,7,0>: Cost 2 vsldoi4 <7,7,7,7>, LHS
+  2328728623U, // <7,7,7,1>: Cost 3 vmrglw <7,7,7,7>, <7,0,7,1>
+  2724746451U, // <7,7,7,2>: Cost 3 vsldoi8 <6,6,7,7>, <7,2,7,3>
+  2322092538U, // <7,7,7,3>: Cost 3 vmrglw <6,6,7,7>, <6,2,7,3>
+  1590529334U, // <7,7,7,4>: Cost 2 vsldoi4 <7,7,7,7>, RHS
+  2328728951U, // <7,7,7,5>: Cost 3 vmrglw <7,7,7,7>, <7,4,7,5>
+  2724746770U, // <7,7,7,6>: Cost 3 vsldoi8 <6,6,7,7>, <7,6,6,7>
+  430361910U,  // <7,7,7,7>: Cost 1 vspltisw3 RHS
+  430361910U,  // <7,7,7,u>: Cost 1 vspltisw3 RHS
+  1242320994U, // <7,7,u,0>: Cost 2 vmrglw <5,6,7,0>, <5,6,7,0>
+  1705580162U, // <7,7,u,1>: Cost 2 vsldoi12 RHS, <7,u,1,2>
+  2779321996U, // <7,7,u,2>: Cost 3 vsldoi12 RHS, <7,u,2,3>
+  1245663738U, // <7,7,u,3>: Cost 2 vmrglw <6,2,7,3>, <6,2,7,3>
+  1242353766U, // <7,7,u,4>: Cost 2 vmrglw <5,6,7,4>, <5,6,7,4>
+  1705580202U, // <7,7,u,5>: Cost 2 vsldoi12 RHS, <7,u,5,6>
+  1662949620U, // <7,7,u,6>: Cost 2 vsldoi8 <u,6,7,7>, <u,6,7,7>
+  430361910U,  // <7,7,u,7>: Cost 1 vspltisw3 RHS
+  430361910U,  // <7,7,u,u>: Cost 1 vspltisw3 RHS
+  1705426944U, // <7,u,0,0>: Cost 2 vsldoi12 RHS, <0,0,0,0>
+  1705432787U, // <7,u,0,1>: Cost 2 vsldoi12 RHS, <u,0,1,2>
+  2316060885U, // <7,u,0,2>: Cost 3 vmrglw <5,6,7,0>, <3,0,u,2>
+  1242316956U, // <7,u,0,3>: Cost 2 vmrglw <5,6,7,0>, LHS
+  2779174637U, // <7,u,0,4>: Cost 3 vsldoi12 RHS, <u,0,4,1>
+  1182750874U, // <7,u,0,5>: Cost 2 vmrghw <7,0,1,2>, RHS
+  2316061213U, // <7,u,0,6>: Cost 3 vmrglw <5,6,7,0>, <3,4,u,6>
+  1242320200U, // <7,u,0,7>: Cost 2 vmrglw <5,6,7,0>, RHS
+  1705432850U, // <7,u,0,u>: Cost 2 vsldoi12 RHS, <u,0,u,2>
+  1584578662U, // <7,u,1,0>: Cost 2 vsldoi4 <6,7,u,1>, LHS
+  1705427764U, // <7,u,1,1>: Cost 2 vsldoi12 RHS, <1,1,1,1>
+  631691054U,  // <7,u,1,2>: Cost 1 vsldoi12 RHS, LHS
+  2640407307U, // <7,u,1,3>: Cost 3 vsldoi4 <3,7,u,1>, <3,7,u,1>
+  1584581942U, // <7,u,1,4>: Cost 2 vsldoi4 <6,7,u,1>, RHS
+  2779174726U, // <7,u,1,5>: Cost 3 vsldoi12 RHS, <u,1,5,0>
+  1584583574U, // <7,u,1,6>: Cost 2 vsldoi4 <6,7,u,1>, <6,7,u,1>
+  2779322201U, // <7,u,1,7>: Cost 3 vsldoi12 RHS, <u,1,7,1>
+  631691108U,  // <7,u,1,u>: Cost 1 vsldoi12 RHS, LHS
+  2779174763U, // <7,u,2,0>: Cost 3 vsldoi12 RHS, <u,2,0,1>
+  2779174774U, // <7,u,2,1>: Cost 3 vsldoi12 RHS, <u,2,1,3>
+  1705428584U, // <7,u,2,2>: Cost 2 vsldoi12 RHS, <2,2,2,2>
+  1705432965U, // <7,u,2,3>: Cost 2 vsldoi12 RHS, <u,2,3,0>
+  2779174801U, // <7,u,2,4>: Cost 3 vsldoi12 RHS, <u,2,4,3>
+  2779174810U, // <7,u,2,5>: Cost 3 vsldoi12 RHS, <u,2,5,3>
+  2767673251U, // <7,u,2,6>: Cost 3 vsldoi12 <2,6,3,7>, <u,2,6,3>
+  1705580460U, // <7,u,2,7>: Cost 2 vsldoi12 RHS, <u,2,7,3>
+  1705433010U, // <7,u,2,u>: Cost 2 vsldoi12 RHS, <u,2,u,0>
+  1705433020U, // <7,u,3,0>: Cost 2 vsldoi12 RHS, <u,3,0,1>
+  2779174853U, // <7,u,3,1>: Cost 3 vsldoi12 RHS, <u,3,1,1>
+  2767673299U, // <7,u,3,2>: Cost 3 vsldoi12 <2,6,3,7>, <u,3,2,6>
+  1245659292U, // <7,u,3,3>: Cost 2 vmrglw <6,2,7,3>, LHS
+  1705433060U, // <7,u,3,4>: Cost 2 vsldoi12 RHS, <u,3,4,5>
+  2779174893U, // <7,u,3,5>: Cost 3 vsldoi12 RHS, <u,3,5,5>
+  2706836152U, // <7,u,3,6>: Cost 3 vsldoi8 <3,6,7,u>, <3,6,7,u>
+  1245662536U, // <7,u,3,7>: Cost 2 vmrglw <6,2,7,3>, RHS
+  1705433092U, // <7,u,3,u>: Cost 2 vsldoi12 RHS, <u,3,u,1>
+  2779174925U, // <7,u,4,0>: Cost 3 vsldoi12 RHS, <u,4,0,1>
+  1185732398U, // <7,u,4,1>: Cost 2 vmrghw <7,4,5,6>, LHS
+  2316093653U, // <7,u,4,2>: Cost 3 vmrglw <5,6,7,4>, <3,0,u,2>
+  1242349724U, // <7,u,4,3>: Cost 2 vmrglw <5,6,7,4>, LHS
+  1705430224U, // <7,u,4,4>: Cost 2 vsldoi12 RHS, <4,4,4,4>
+  1705433151U, // <7,u,4,5>: Cost 2 vsldoi12 RHS, <u,4,5,6>
+  2316093981U, // <7,u,4,6>: Cost 3 vmrglw <5,6,7,4>, <3,4,u,6>
+  1242352968U, // <7,u,4,7>: Cost 2 vmrglw <5,6,7,4>, RHS
+  1705433178U, // <7,u,4,u>: Cost 2 vsldoi12 RHS, <u,4,u,6>
+  1584611430U, // <7,u,5,0>: Cost 2 vsldoi4 <6,7,u,5>, LHS
+  2781165670U, // <7,u,5,1>: Cost 3 vsldoi12 RHS, <u,5,1,0>
+  2640439226U, // <7,u,5,2>: Cost 3 vsldoi4 <3,7,u,5>, <2,6,3,7>
+  2640440079U, // <7,u,5,3>: Cost 3 vsldoi4 <3,7,u,5>, <3,7,u,5>
+  1584614710U, // <7,u,5,4>: Cost 2 vsldoi4 <6,7,u,5>, RHS
+  1705431044U, // <7,u,5,5>: Cost 2 vsldoi12 RHS, <5,5,5,5>
+  631691418U,  // <7,u,5,6>: Cost 1 vsldoi12 RHS, RHS
+  2779322525U, // <7,u,5,7>: Cost 3 vsldoi12 RHS, <u,5,7,1>
+  631691436U,  // <7,u,5,u>: Cost 1 vsldoi12 RHS, RHS
+  2779175087U, // <7,u,6,0>: Cost 3 vsldoi12 RHS, <u,6,0,1>
+  2779175102U, // <7,u,6,1>: Cost 3 vsldoi12 RHS, <u,6,1,7>
+  1648357887U, // <7,u,6,2>: Cost 2 vsldoi8 <6,2,7,u>, <6,2,7,u>
+  1705433296U, // <7,u,6,3>: Cost 2 vsldoi12 RHS, <u,6,3,7>
+  2779175127U, // <7,u,6,4>: Cost 3 vsldoi12 RHS, <u,6,4,5>
+  2779175138U, // <7,u,6,5>: Cost 3 vsldoi12 RHS, <u,6,5,7>
+  1651012419U, // <7,u,6,6>: Cost 2 vsldoi8 <6,6,7,u>, <6,6,7,u>
+  1705580788U, // <7,u,6,7>: Cost 2 vsldoi12 RHS, <u,6,7,7>
+  1705433341U, // <7,u,6,u>: Cost 2 vsldoi12 RHS, <u,6,u,7>
+  1705580800U, // <7,u,7,0>: Cost 2 vsldoi12 RHS, <u,7,0,1>
+  1187878702U, // <7,u,7,1>: Cost 2 vmrghw <7,7,7,7>, LHS
+  2768042263U, // <7,u,7,2>: Cost 3 vsldoi12 <2,6,u,7>, <u,7,2,6>
+  1248346268U, // <7,u,7,3>: Cost 2 vmrglw <6,6,7,7>, LHS
+  1705580840U, // <7,u,7,4>: Cost 2 vsldoi12 RHS, <u,7,4,5>
+  1187879066U, // <7,u,7,5>: Cost 2 vmrghw <7,7,7,7>, RHS
+  2779322679U, // <7,u,7,6>: Cost 3 vsldoi12 RHS, <u,7,6,2>
+  430361910U,  // <7,u,7,7>: Cost 1 vspltisw3 RHS
+  430361910U,  // <7,u,7,u>: Cost 1 vspltisw3 RHS
+  1705433425U, // <7,u,u,0>: Cost 2 vsldoi12 RHS, <u,u,0,1>
+  1705433435U, // <7,u,u,1>: Cost 2 vsldoi12 RHS, <u,u,1,2>
+  631691621U,  // <7,u,u,2>: Cost 1 vsldoi12 RHS, LHS
+  1705433451U, // <7,u,u,3>: Cost 2 vsldoi12 RHS, <u,u,3,0>
+  1705433465U, // <7,u,u,4>: Cost 2 vsldoi12 RHS, <u,u,4,5>
+  1705433475U, // <7,u,u,5>: Cost 2 vsldoi12 RHS, <u,u,5,6>
+  631691661U,  // <7,u,u,6>: Cost 1 vsldoi12 RHS, RHS
+  430361910U,  // <7,u,u,7>: Cost 1 vspltisw3 RHS
+  631691675U,  // <7,u,u,u>: Cost 1 vsldoi12 RHS, LHS
+  202162278U,  // <u,0,0,0>: Cost 1 vspltisw0 LHS
+  1678598154U, // <u,0,0,1>: Cost 2 vsldoi12 LHS, <0,0,1,1>
+  2634500154U, // <u,0,0,2>: Cost 3 vsldoi4 <2,u,0,0>, <2,u,0,0>
+  2289596269U, // <u,0,0,3>: Cost 3 vmrglw <1,2,u,0>, <u,2,0,3>
+  1548815670U, // <u,0,0,4>: Cost 2 vsldoi4 <0,u,0,0>, RHS
+  2663698530U, // <u,0,0,5>: Cost 3 vsldoi4 <7,7,0,0>, <5,6,7,0>
+  2658390942U, // <u,0,0,6>: Cost 3 vsldoi4 <6,u,0,0>, <6,u,0,0>
+  2289596597U, // <u,0,0,7>: Cost 3 vmrglw <1,2,u,0>, <u,6,0,7>
+  202162278U,  // <u,0,0,u>: Cost 1 vspltisw0 LHS
+  1560764518U, // <u,0,1,0>: Cost 2 vsldoi4 <2,u,0,1>, LHS
+  115720294U,  // <u,0,1,1>: Cost 1 vmrghw LHS, LHS
+  604856427U,  // <u,0,1,2>: Cost 1 vsldoi12 LHS, LHS
+  2634508438U, // <u,0,1,3>: Cost 3 vsldoi4 <2,u,0,1>, <3,0,1,2>
+  1560767798U, // <u,0,1,4>: Cost 2 vsldoi4 <2,u,0,1>, RHS
+  2652426438U, // <u,0,1,5>: Cost 3 vsldoi4 <5,u,0,1>, <5,u,0,1>
+  1584657311U, // <u,0,1,6>: Cost 2 vsldoi4 <6,u,0,1>, <6,u,0,1>
+  2658399226U, // <u,0,1,7>: Cost 3 vsldoi4 <6,u,0,1>, <7,0,1,2>
+  604856476U,  // <u,0,1,u>: Cost 1 vsldoi12 LHS, LHS
+  2696889850U, // <u,0,2,0>: Cost 3 vsldoi8 <2,0,u,0>, <2,0,u,0>
+  1190174822U, // <u,0,2,1>: Cost 2 vmrghw <u,2,3,0>, LHS
+  2692245096U, // <u,0,2,2>: Cost 3 vsldoi8 <1,2,u,0>, <2,2,2,2>
+  2692245158U, // <u,0,2,3>: Cost 3 vsldoi8 <1,2,u,0>, <2,3,0,1>
+  2263916882U, // <u,0,2,4>: Cost 3 vmrghw <u,2,3,0>, <0,4,1,5>
+  2299709908U, // <u,0,2,5>: Cost 3 vmrglw <3,0,1,2>, <3,4,0,5>
+  2692245434U, // <u,0,2,6>: Cost 3 vsldoi8 <1,2,u,0>, <2,6,3,7>
+  2701535281U, // <u,0,2,7>: Cost 3 vsldoi8 <2,7,u,0>, <2,7,u,0>
+  1190175389U, // <u,0,2,u>: Cost 2 vmrghw <u,2,3,0>, LHS
+  1209237504U, // <u,0,3,0>: Cost 2 vmrglw LHS, <0,0,0,0>
+  1209239206U, // <u,0,3,1>: Cost 2 vmrglw LHS, <2,3,0,1>
+  2704189813U, // <u,0,3,2>: Cost 3 vsldoi8 <3,2,u,0>, <3,2,u,0>
+  2692245916U, // <u,0,3,3>: Cost 3 vsldoi8 <1,2,u,0>, <3,3,3,3>
+  2282981033U, // <u,0,3,4>: Cost 3 vmrglw LHS, <2,3,0,4>
+  2664386658U, // <u,0,3,5>: Cost 3 vsldoi4 <7,u,0,3>, <5,6,7,0>
+  2691877496U, // <u,0,3,6>: Cost 3 vsldoi8 <1,2,3,0>, <3,6,0,7>
+  2664388218U, // <u,0,3,7>: Cost 3 vsldoi4 <7,u,0,3>, <7,u,0,3>
+  1209239213U, // <u,0,3,u>: Cost 2 vmrglw LHS, <2,3,0,u>
+  2289623040U, // <u,0,4,0>: Cost 3 vmrglw <1,2,u,4>, <0,0,0,0>
+  1678598482U, // <u,0,4,1>: Cost 2 vsldoi12 LHS, <0,4,1,5>
+  2634532926U, // <u,0,4,2>: Cost 3 vsldoi4 <2,u,0,4>, <2,u,0,4>
+  2235580672U, // <u,0,4,3>: Cost 3 vmrghw <3,4,5,6>, <0,3,1,4>
+  1143619922U, // <u,0,4,4>: Cost 2 vmrghw <0,4,1,5>, <0,4,1,5>
+  1618505014U, // <u,0,4,5>: Cost 2 vsldoi8 <1,2,u,0>, RHS
+  2658423714U, // <u,0,4,6>: Cost 3 vsldoi4 <6,u,0,4>, <6,u,0,4>
+  2713259464U, // <u,0,4,7>: Cost 3 vsldoi8 <4,7,5,0>, <4,7,5,0>
+  1683243409U, // <u,0,4,u>: Cost 2 vsldoi12 LHS, <0,4,u,5>
+  1192443904U, // <u,0,5,0>: Cost 2 vmrghw RHS, <0,0,0,0>
+  118702182U,  // <u,0,5,1>: Cost 1 vmrghw RHS, LHS
+  2266185901U, // <u,0,5,2>: Cost 3 vmrghw RHS, <0,2,1,2>
+  2640513816U, // <u,0,5,3>: Cost 3 vsldoi4 <3,u,0,5>, <3,u,0,5>
+  1192444242U, // <u,0,5,4>: Cost 2 vmrghw RHS, <0,4,1,5>
+  2718789636U, // <u,0,5,5>: Cost 3 vsldoi8 <5,6,u,0>, <5,5,5,5>
+  1645047915U, // <u,0,5,6>: Cost 2 vsldoi8 <5,6,u,0>, <5,6,u,0>
+  2664404604U, // <u,0,5,7>: Cost 3 vsldoi4 <7,u,0,5>, <7,u,0,5>
+  118702749U,  // <u,0,5,u>: Cost 1 vmrghw RHS, LHS
+  2302910464U, // <u,0,6,0>: Cost 3 vmrglw <3,4,u,6>, <0,0,0,0>
+  1192886374U, // <u,0,6,1>: Cost 2 vmrghw <u,6,3,7>, LHS
+  2718790138U, // <u,0,6,2>: Cost 3 vsldoi8 <5,6,u,0>, <6,2,7,3>
+  2722771537U, // <u,0,6,3>: Cost 3 vsldoi8 <6,3,u,0>, <6,3,u,0>
+  2266628434U, // <u,0,6,4>: Cost 3 vmrghw <u,6,3,7>, <0,4,1,5>
+  2248950180U, // <u,0,6,5>: Cost 3 vmrghw <5,6,7,0>, <0,5,1,6>
+  2718790456U, // <u,0,6,6>: Cost 3 vsldoi8 <5,6,u,0>, <6,6,6,6>
+  2718790478U, // <u,0,6,7>: Cost 3 vsldoi8 <5,6,u,0>, <6,7,0,1>
+  1192886941U, // <u,0,6,u>: Cost 2 vmrghw <u,6,3,7>, LHS
+  1235812352U, // <u,0,7,0>: Cost 2 vmrglw RHS, <0,0,0,0>
+  1235814054U, // <u,0,7,1>: Cost 2 vmrglw RHS, <2,3,0,1>
+  2728080601U, // <u,0,7,2>: Cost 3 vsldoi8 <7,2,u,0>, <7,2,u,0>
+  2640530202U, // <u,0,7,3>: Cost 3 vsldoi4 <3,u,0,7>, <3,u,0,7>
+  2640530742U, // <u,0,7,4>: Cost 3 vsldoi4 <3,u,0,7>, RHS
+  2309556692U, // <u,0,7,5>: Cost 3 vmrglw RHS, <3,4,0,5>
+  2730735133U, // <u,0,7,6>: Cost 3 vsldoi8 <7,6,u,0>, <7,6,u,0>
+  2309556856U, // <u,0,7,7>: Cost 3 vmrglw RHS, <3,6,0,7>
+  1235814061U, // <u,0,7,u>: Cost 2 vmrglw RHS, <2,3,0,u>
+  202162278U,  // <u,0,u,0>: Cost 1 vspltisw0 LHS
+  120365158U,  // <u,0,u,1>: Cost 1 vmrghw LHS, LHS
+  604856989U,  // <u,0,u,2>: Cost 1 vsldoi12 LHS, LHS
+  2692249532U, // <u,0,u,3>: Cost 3 vsldoi8 <1,2,u,0>, <u,3,0,1>
+  1560825142U, // <u,0,u,4>: Cost 2 vsldoi4 <2,u,0,u>, RHS
+  1618507930U, // <u,0,u,5>: Cost 2 vsldoi8 <1,2,u,0>, RHS
+  1584714662U, // <u,0,u,6>: Cost 2 vsldoi4 <6,u,0,u>, <6,u,0,u>
+  2309565048U, // <u,0,u,7>: Cost 3 vmrglw RHS, <3,6,0,7>
+  604857043U,  // <u,0,u,u>: Cost 1 vsldoi12 LHS, LHS
+  1611210825U, // <u,1,0,0>: Cost 2 vsldoi8 <0,0,u,1>, <0,0,u,1>
+  1616519270U, // <u,1,0,1>: Cost 2 vsldoi8 <0,u,u,1>, LHS
+  2287605459U, // <u,1,0,2>: Cost 3 vmrglw <0,u,u,0>, <u,0,1,2>
+  2640546588U, // <u,1,0,3>: Cost 3 vsldoi4 <3,u,1,0>, <3,u,1,0>
+  2622631222U, // <u,1,0,4>: Cost 3 vsldoi4 <0,u,1,0>, RHS
+  2289590610U, // <u,1,0,5>: Cost 3 vmrglw <1,2,u,0>, <0,4,1,5>
+  2664436630U, // <u,1,0,6>: Cost 3 vsldoi4 <7,u,1,0>, <6,7,u,1>
+  2664437376U, // <u,1,0,7>: Cost 3 vsldoi4 <7,u,1,0>, <7,u,1,0>
+  1616519889U, // <u,1,0,u>: Cost 2 vsldoi8 <0,u,u,1>, <0,u,u,1>
+  1548894866U, // <u,1,1,0>: Cost 2 vsldoi4 <0,u,1,1>, <0,u,1,1>
+  269271142U,  // <u,1,1,1>: Cost 1 vspltisw1 LHS
+  1189462934U, // <u,1,1,2>: Cost 2 vmrghw LHS, <1,2,3,0>
+  2622638230U, // <u,1,1,3>: Cost 3 vsldoi4 <0,u,1,1>, <3,0,1,2>
+  1548897590U, // <u,1,1,4>: Cost 2 vsldoi4 <0,u,1,1>, RHS
+  2756985692U, // <u,1,1,5>: Cost 3 vsldoi12 LHS, <1,1,5,5>
+  2658472872U, // <u,1,1,6>: Cost 3 vsldoi4 <6,u,1,1>, <6,u,1,1>
+  2287614142U, // <u,1,1,7>: Cost 3 vmrglw <0,u,u,1>, <u,6,1,7>
+  269271142U,  // <u,1,1,u>: Cost 1 vspltisw1 LHS
+  1566818406U, // <u,1,2,0>: Cost 2 vsldoi4 <3,u,1,2>, LHS
+  2756985735U, // <u,1,2,1>: Cost 3 vsldoi12 LHS, <1,2,1,3>
+  1148371862U, // <u,1,2,2>: Cost 2 vmrghw <1,2,3,0>, <1,2,3,0>
   835584U,     // <u,1,2,3>: Cost 0 copy LHS
-  2640563510U, // <u,1,2,4>: Cost 2 vsldoi4 <3,u,1,2>, RHS
-  3830727595U, // <u,1,2,5>: Cost 3 vsldoi12 LHS, <1,2,5,3>
-  3764004794U, // <u,1,2,6>: Cost 3 vsldoi8 <0,u,u,1>, <2,6,3,7>
-  2664453762U, // <u,1,2,7>: Cost 2 vsldoi4 <7,u,1,2>, <7,u,1,2>
+  1566821686U, // <u,1,2,4>: Cost 2 vsldoi4 <3,u,1,2>, RHS
+  2756985771U, // <u,1,2,5>: Cost 3 vsldoi12 LHS, <1,2,5,3>
+  2690262970U, // <u,1,2,6>: Cost 3 vsldoi8 <0,u,u,1>, <2,6,3,7>
+  1590711938U, // <u,1,2,7>: Cost 2 vsldoi4 <7,u,1,2>, <7,u,1,2>
   835584U,     // <u,1,2,u>: Cost 0 copy LHS
-  3356721161U, // <u,1,3,0>: Cost 3 vmrglw LHS, <0,0,1,0>
-  2282979338U, // <u,1,3,1>: Cost 2 vmrglw LHS, <0,0,1,1>
-  2282981526U, // <u,1,3,2>: Cost 2 vmrglw LHS, <3,0,1,2>
-  3356721326U, // <u,1,3,3>: Cost 3 vmrglw LHS, <0,2,1,3>
-  3356721165U, // <u,1,3,4>: Cost 3 vmrglw LHS, <0,0,1,4>
-  2282979666U, // <u,1,3,5>: Cost 2 vmrglw LHS, <0,4,1,5>
-  3356721329U, // <u,1,3,6>: Cost 3 vmrglw LHS, <0,2,1,6>
-  3361367247U, // <u,1,3,7>: Cost 3 vmrglw LHS, <1,6,1,7>
-  2282979345U, // <u,1,3,u>: Cost 2 vmrglw LHS, <0,0,1,u>
-  2708843437U, // <u,1,4,0>: Cost 2 vsldoi8 <4,0,u,1>, <4,0,u,1>
-  3363364874U, // <u,1,4,1>: Cost 3 vmrglw <1,2,u,4>, <0,0,1,1>
-  3363367062U, // <u,1,4,2>: Cost 3 vmrglw <1,2,u,4>, <3,0,1,2>
-  3714321184U, // <u,1,4,3>: Cost 3 vsldoi4 <3,u,1,4>, <3,u,1,4>
-  3696405814U, // <u,1,4,4>: Cost 3 vsldoi4 <0,u,1,4>, RHS
-  2690264374U, // <u,1,4,5>: Cost 2 vsldoi8 <0,u,u,1>, RHS
-  3738211222U, // <u,1,4,6>: Cost 3 vsldoi4 <7,u,1,4>, <6,7,u,1>
-  3738211972U, // <u,1,4,7>: Cost 3 vsldoi4 <7,u,1,4>, <7,u,1,4>
-  2690264617U, // <u,1,4,u>: Cost 2 vsldoi8 <0,u,u,1>, RHS
-  2622669462U, // <u,1,5,0>: Cost 2 vsldoi4 <0,u,1,5>, <0,u,1,5>
-  2266186548U, // <u,1,5,1>: Cost 2 vmrghw RHS, <1,1,1,1>
-  2266186646U, // <u,1,5,2>: Cost 2 vmrghw RHS, <1,2,3,0>
-  3696412822U, // <u,1,5,3>: Cost 3 vsldoi4 <0,u,1,5>, <3,0,1,2>
-  2622672182U, // <u,1,5,4>: Cost 2 vsldoi4 <0,u,1,5>, RHS
-  2284470610U, // <u,1,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
-  3787894882U, // <u,1,5,6>: Cost 3 vsldoi8 <4,u,u,1>, <5,6,7,0>
-  3744191482U, // <u,1,5,7>: Cost 3 vsldoi4 <u,u,1,5>, <7,0,1,2>
-  2622674734U, // <u,1,5,u>: Cost 2 vsldoi4 <0,u,1,5>, LHS
-  3696419479U, // <u,1,6,0>: Cost 3 vsldoi4 <0,u,1,6>, <0,u,1,6>
-  3830727887U, // <u,1,6,1>: Cost 3 vsldoi12 LHS, <1,6,1,7>
-  3376654486U, // <u,1,6,2>: Cost 3 vmrglw <3,4,u,6>, <3,0,1,2>
+  2282979337U, // <u,1,3,0>: Cost 3 vmrglw LHS, <0,0,1,0>
+  1209237514U, // <u,1,3,1>: Cost 2 vmrglw LHS, <0,0,1,1>
+  1209239702U, // <u,1,3,2>: Cost 2 vmrglw LHS, <3,0,1,2>
+  2282979502U, // <u,1,3,3>: Cost 3 vmrglw LHS, <0,2,1,3>
+  2282979341U, // <u,1,3,4>: Cost 3 vmrglw LHS, <0,0,1,4>
+  1209237842U, // <u,1,3,5>: Cost 2 vmrglw LHS, <0,4,1,5>
+  2282979505U, // <u,1,3,6>: Cost 3 vmrglw LHS, <0,2,1,6>
+  2287625423U, // <u,1,3,7>: Cost 3 vmrglw LHS, <1,6,1,7>
+  1209237521U, // <u,1,3,u>: Cost 2 vmrglw LHS, <0,0,1,u>
+  1635101613U, // <u,1,4,0>: Cost 2 vsldoi8 <4,0,u,1>, <4,0,u,1>
+  2289623050U, // <u,1,4,1>: Cost 3 vmrglw <1,2,u,4>, <0,0,1,1>
+  2289625238U, // <u,1,4,2>: Cost 3 vmrglw <1,2,u,4>, <3,0,1,2>
+  2640579360U, // <u,1,4,3>: Cost 3 vsldoi4 <3,u,1,4>, <3,u,1,4>
+  2622663990U, // <u,1,4,4>: Cost 3 vsldoi4 <0,u,1,4>, RHS
+  1616522550U, // <u,1,4,5>: Cost 2 vsldoi8 <0,u,u,1>, RHS
+  2664469398U, // <u,1,4,6>: Cost 3 vsldoi4 <7,u,1,4>, <6,7,u,1>
+  2664470148U, // <u,1,4,7>: Cost 3 vsldoi4 <7,u,1,4>, <7,u,1,4>
+  1616522793U, // <u,1,4,u>: Cost 2 vsldoi8 <0,u,u,1>, RHS
+  1548927638U, // <u,1,5,0>: Cost 2 vsldoi4 <0,u,1,5>, <0,u,1,5>
+  1192444724U, // <u,1,5,1>: Cost 2 vmrghw RHS, <1,1,1,1>
+  1192444822U, // <u,1,5,2>: Cost 2 vmrghw RHS, <1,2,3,0>
+  2622670998U, // <u,1,5,3>: Cost 3 vsldoi4 <0,u,1,5>, <3,0,1,2>
+  1548930358U, // <u,1,5,4>: Cost 2 vsldoi4 <0,u,1,5>, RHS
+  1210728786U, // <u,1,5,5>: Cost 2 vmrglw <0,4,1,5>, <0,4,1,5>
+  2714153058U, // <u,1,5,6>: Cost 3 vsldoi8 <4,u,u,1>, <5,6,7,0>
+  2670449658U, // <u,1,5,7>: Cost 3 vsldoi4 <u,u,1,5>, <7,0,1,2>
+  1548932910U, // <u,1,5,u>: Cost 2 vsldoi4 <0,u,1,5>, LHS
+  2622677655U, // <u,1,6,0>: Cost 3 vsldoi4 <0,u,1,6>, <0,u,1,6>
+  2756986063U, // <u,1,6,1>: Cost 3 vsldoi12 LHS, <1,6,1,7>
+  2302912662U, // <u,1,6,2>: Cost 3 vmrglw <3,4,u,6>, <3,0,1,2>
   3696421014U, // <u,1,6,3>: Cost 4 vsldoi4 <0,u,1,6>, <3,0,1,2>
-  3696422198U, // <u,1,6,4>: Cost 3 vsldoi4 <0,u,1,6>, RHS
-  3830727923U, // <u,1,6,5>: Cost 3 vsldoi12 LHS, <1,6,5,7>
-  3787895608U, // <u,1,6,6>: Cost 3 vsldoi8 <4,u,u,1>, <6,6,6,6>
-  2725434262U, // <u,1,6,7>: Cost 2 vsldoi8 <6,7,u,1>, <6,7,u,1>
-  2726097895U, // <u,1,6,u>: Cost 2 vsldoi8 <6,u,u,1>, <6,u,u,1>
-  3702399078U, // <u,1,7,0>: Cost 3 vsldoi4 <1,u,1,7>, LHS
-  2309554186U, // <u,1,7,1>: Cost 2 vmrglw RHS, <0,0,1,1>
-  2309556374U, // <u,1,7,2>: Cost 2 vmrglw RHS, <3,0,1,2>
-  3383296174U, // <u,1,7,3>: Cost 3 vmrglw RHS, <0,2,1,3>
-  3702402358U, // <u,1,7,4>: Cost 3 vsldoi4 <1,u,1,7>, RHS
-  2309554514U, // <u,1,7,5>: Cost 2 vmrglw RHS, <0,4,1,5>
-  3383296177U, // <u,1,7,6>: Cost 3 vmrglw RHS, <0,2,1,6>
-  3383296502U, // <u,1,7,7>: Cost 3 vmrglw RHS, <0,6,1,7>
-  2309554193U, // <u,1,7,u>: Cost 2 vmrglw RHS, <0,0,1,u>
-  2622694041U, // <u,1,u,0>: Cost 2 vsldoi4 <0,u,1,u>, <0,u,1,u>
-  1343012966U, // <u,1,u,1>: Cost 1 vspltisw1 LHS
-  2283022486U, // <u,1,u,2>: Cost 2 vmrglw LHS, <3,0,1,2>
+  2622680374U, // <u,1,6,4>: Cost 3 vsldoi4 <0,u,1,6>, RHS
+  2756986099U, // <u,1,6,5>: Cost 3 vsldoi12 LHS, <1,6,5,7>
+  2714153784U, // <u,1,6,6>: Cost 3 vsldoi8 <4,u,u,1>, <6,6,6,6>
+  1651692438U, // <u,1,6,7>: Cost 2 vsldoi8 <6,7,u,1>, <6,7,u,1>
+  1652356071U, // <u,1,6,u>: Cost 2 vsldoi8 <6,u,u,1>, <6,u,u,1>
+  2628657254U, // <u,1,7,0>: Cost 3 vsldoi4 <1,u,1,7>, LHS
+  1235812362U, // <u,1,7,1>: Cost 2 vmrglw RHS, <0,0,1,1>
+  1235814550U, // <u,1,7,2>: Cost 2 vmrglw RHS, <3,0,1,2>
+  2309554350U, // <u,1,7,3>: Cost 3 vmrglw RHS, <0,2,1,3>
+  2628660534U, // <u,1,7,4>: Cost 3 vsldoi4 <1,u,1,7>, RHS
+  1235812690U, // <u,1,7,5>: Cost 2 vmrglw RHS, <0,4,1,5>
+  2309554353U, // <u,1,7,6>: Cost 3 vmrglw RHS, <0,2,1,6>
+  2309554678U, // <u,1,7,7>: Cost 3 vmrglw RHS, <0,6,1,7>
+  1235812369U, // <u,1,7,u>: Cost 2 vmrglw RHS, <0,0,1,u>
+  1548952217U, // <u,1,u,0>: Cost 2 vsldoi4 <0,u,1,u>, <0,u,1,u>
+  269271142U,  // <u,1,u,1>: Cost 1 vspltisw1 LHS
+  1209280662U, // <u,1,u,2>: Cost 2 vmrglw LHS, <3,0,1,2>
   835584U,     // <u,1,u,3>: Cost 0 copy LHS
-  2622696758U, // <u,1,u,4>: Cost 2 vsldoi4 <0,u,1,u>, RHS
-  2283020626U, // <u,1,u,5>: Cost 2 vmrglw LHS, <0,4,1,5>
-  3356762289U, // <u,1,u,6>: Cost 3 vmrglw LHS, <0,2,1,6>
-  2664502920U, // <u,1,u,7>: Cost 2 vsldoi4 <7,u,1,u>, <7,u,1,u>
+  1548954934U, // <u,1,u,4>: Cost 2 vsldoi4 <0,u,1,u>, RHS
+  1209278802U, // <u,1,u,5>: Cost 2 vmrglw LHS, <0,4,1,5>
+  2283020465U, // <u,1,u,6>: Cost 3 vmrglw LHS, <0,2,1,6>
+  1590761096U, // <u,1,u,7>: Cost 2 vsldoi4 <7,u,1,u>, <7,u,1,u>
   835584U,     // <u,1,u,u>: Cost 0 copy LHS
-  3776618496U, // <u,2,0,0>: Cost 3 vsldoi8 <3,0,u,2>, <0,0,0,0>
-  2702876774U, // <u,2,0,1>: Cost 2 vsldoi8 <3,0,u,2>, LHS
-  3363333736U, // <u,2,0,2>: Cost 3 vmrglw <1,2,u,0>, <2,2,2,2>
-  2289590374U, // <u,2,0,3>: Cost 2 vmrglw <1,2,u,0>, LHS
-  3776618834U, // <u,2,0,4>: Cost 3 vsldoi8 <3,0,u,2>, <0,4,1,5>
-  3362964532U, // <u,2,0,5>: Cost 3 vmrglw <1,2,3,0>, <1,4,2,5>
-  3852920297U, // <u,2,0,6>: Cost 3 vsldoi12 RHS, <2,0,6,1>
-  3799990848U, // <u,2,0,7>: Cost 3 vsldoi8 <7,0,1,2>, <0,7,1,0>
-  2289590379U, // <u,2,0,u>: Cost 2 vmrglw <1,2,u,0>, LHS
-  3764675363U, // <u,2,1,0>: Cost 3 vsldoi8 <1,0,u,2>, <1,0,u,2>
-  3702424948U, // <u,2,1,1>: Cost 3 vsldoi4 <1,u,2,1>, <1,u,2,1>
-  2263205480U, // <u,2,1,2>: Cost 2 vmrghw LHS, <2,2,2,2>
-  2287607910U, // <u,2,1,3>: Cost 2 vmrglw <0,u,u,1>, LHS
-  3702426934U, // <u,2,1,4>: Cost 3 vsldoi4 <1,u,2,1>, RHS
-  3336947560U, // <u,2,1,5>: Cost 3 vmrghw LHS, <2,5,3,6>
-  2263205818U, // <u,2,1,6>: Cost 2 vmrghw LHS, <2,6,3,7>
-  3336947690U, // <u,2,1,7>: Cost 3 vmrghw LHS, <2,7,0,1>
-  2287607915U, // <u,2,1,u>: Cost 2 vmrglw <0,u,u,1>, LHS
-  2630680678U, // <u,2,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
-  3771311693U, // <u,2,2,1>: Cost 3 vsldoi8 <2,1,u,2>, <2,1,u,2>
-  1410121830U, // <u,2,2,2>: Cost 1 vspltisw2 LHS
-  2752341618U, // <u,2,2,3>: Cost 2 vsldoi12 LHS, <2,2,3,3>
-  2630683958U, // <u,2,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
-  3368879885U, // <u,2,2,5>: Cost 3 vmrglw <2,2,2,2>, <2,4,2,5>
-  3776620474U, // <u,2,2,6>: Cost 3 vsldoi8 <3,0,u,2>, <2,6,3,7>
-  3373971655U, // <u,2,2,7>: Cost 3 vmrglw <3,0,u,2>, <u,6,2,7>
-  1410121830U, // <u,2,2,u>: Cost 1 vspltisw2 LHS
-  1548984989U, // <u,2,3,0>: Cost 1 vsldoi4 LHS, LHS
-  2622726964U, // <u,2,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
-  2282980968U, // <u,2,3,2>: Cost 2 vmrglw LHS, <2,2,2,2>
-  1209237606U, // <u,2,3,3>: Cost 1 vmrglw LHS, LHS
-  1548987702U, // <u,2,3,4>: Cost 1 vsldoi4 LHS, RHS
-  2670505988U, // <u,2,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
-  2670506490U, // <u,2,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
-  2670507002U, // <u,2,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
-  1209237611U, // <u,2,3,u>: Cost 1 vmrglw LHS, LHS
-  3782593454U, // <u,2,4,0>: Cost 3 vsldoi8 <4,0,u,2>, <4,0,u,2>
-  3291104803U, // <u,2,4,1>: Cost 3 vmrghw <0,4,1,5>, <2,1,3,5>
-  3363366504U, // <u,2,4,2>: Cost 3 vmrglw <1,2,u,4>, <2,2,2,2>
-  2289623142U, // <u,2,4,3>: Cost 2 vmrglw <1,2,u,4>, LHS
-  3800509648U, // <u,2,4,4>: Cost 3 vsldoi8 <7,0,u,2>, <4,4,4,4>
-  2702880054U, // <u,2,4,5>: Cost 2 vsldoi8 <3,0,u,2>, RHS
-  3852920625U, // <u,2,4,6>: Cost 3 vsldoi12 RHS, <2,4,6,5>
-  3799993800U, // <u,2,4,7>: Cost 3 vsldoi8 <7,0,1,2>, <4,7,5,0>
-  2289623147U, // <u,2,4,u>: Cost 2 vmrglw <1,2,u,4>, LHS
-  3702456422U, // <u,2,5,0>: Cost 3 vsldoi4 <1,u,2,5>, LHS
-  3702457720U, // <u,2,5,1>: Cost 3 vsldoi4 <1,u,2,5>, <1,u,2,5>
-  2266187368U, // <u,2,5,2>: Cost 2 vmrghw RHS, <2,2,2,2>
-  2287640678U, // <u,2,5,3>: Cost 2 vmrglw <0,u,u,5>, LHS
-  3702459702U, // <u,2,5,4>: Cost 3 vsldoi4 <1,u,2,5>, RHS
-  3800510468U, // <u,2,5,5>: Cost 3 vsldoi8 <7,0,u,2>, <5,5,5,5>
-  2266187706U, // <u,2,5,6>: Cost 2 vmrghw RHS, <2,6,3,7>
-  3339929578U, // <u,2,5,7>: Cost 3 vmrghw RHS, <2,7,0,1>
-  2287640683U, // <u,2,5,u>: Cost 2 vmrglw <0,u,u,5>, LHS
-  3708436582U, // <u,2,6,0>: Cost 3 vsldoi4 <2,u,2,6>, LHS
-  3795202481U, // <u,2,6,1>: Cost 3 vsldoi8 <6,1,u,2>, <6,1,u,2>
-  3370681960U, // <u,2,6,2>: Cost 3 vmrglw <2,4,u,6>, <2,2,2,2>
-  2752341946U, // <u,2,6,3>: Cost 2 vsldoi12 LHS, <2,6,3,7>
-  3708439862U, // <u,2,6,4>: Cost 3 vsldoi4 <2,u,2,6>, RHS
+  2702876672U, // <u,2,0,0>: Cost 3 vsldoi8 <3,0,u,2>, <0,0,0,0>
+  1629134950U, // <u,2,0,1>: Cost 2 vsldoi8 <3,0,u,2>, LHS
+  2289591912U, // <u,2,0,2>: Cost 3 vmrglw <1,2,u,0>, <2,2,2,2>
+  1215848550U, // <u,2,0,3>: Cost 2 vmrglw <1,2,u,0>, LHS
+  2702877010U, // <u,2,0,4>: Cost 3 vsldoi8 <3,0,u,2>, <0,4,1,5>
+  2289222708U, // <u,2,0,5>: Cost 3 vmrglw <1,2,3,0>, <1,4,2,5>
+  2779178473U, // <u,2,0,6>: Cost 3 vsldoi12 RHS, <2,0,6,1>
+  2726249024U, // <u,2,0,7>: Cost 3 vsldoi8 <7,0,1,2>, <0,7,1,0>
+  1215848555U, // <u,2,0,u>: Cost 2 vmrglw <1,2,u,0>, LHS
+  2690933539U, // <u,2,1,0>: Cost 3 vsldoi8 <1,0,u,2>, <1,0,u,2>
+  2628683124U, // <u,2,1,1>: Cost 3 vsldoi4 <1,u,2,1>, <1,u,2,1>
+  1189463656U, // <u,2,1,2>: Cost 2 vmrghw LHS, <2,2,2,2>
+  1213866086U, // <u,2,1,3>: Cost 2 vmrglw <0,u,u,1>, LHS
+  2628685110U, // <u,2,1,4>: Cost 3 vsldoi4 <1,u,2,1>, RHS
+  2263205736U, // <u,2,1,5>: Cost 3 vmrghw LHS, <2,5,3,6>
+  1189463994U, // <u,2,1,6>: Cost 2 vmrghw LHS, <2,6,3,7>
+  2263205866U, // <u,2,1,7>: Cost 3 vmrghw LHS, <2,7,0,1>
+  1213866091U, // <u,2,1,u>: Cost 2 vmrglw <0,u,u,1>, LHS
+  1556938854U, // <u,2,2,0>: Cost 2 vsldoi4 <2,2,2,2>, LHS
+  2697569869U, // <u,2,2,1>: Cost 3 vsldoi8 <2,1,u,2>, <2,1,u,2>
+  336380006U,  // <u,2,2,2>: Cost 1 vspltisw2 LHS
+  1678599794U, // <u,2,2,3>: Cost 2 vsldoi12 LHS, <2,2,3,3>
+  1556942134U, // <u,2,2,4>: Cost 2 vsldoi4 <2,2,2,2>, RHS
+  2295138061U, // <u,2,2,5>: Cost 3 vmrglw <2,2,2,2>, <2,4,2,5>
+  2702878650U, // <u,2,2,6>: Cost 3 vsldoi8 <3,0,u,2>, <2,6,3,7>
+  2300229831U, // <u,2,2,7>: Cost 3 vmrglw <3,0,u,2>, <u,6,2,7>
+  336380006U,  // <u,2,2,u>: Cost 1 vspltisw2 LHS
+  475243165U,  // <u,2,3,0>: Cost 1 vsldoi4 LHS, LHS
+  1548985140U, // <u,2,3,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
+  1209239144U, // <u,2,3,2>: Cost 2 vmrglw LHS, <2,2,2,2>
+  135495782U,  // <u,2,3,3>: Cost 1 vmrglw LHS, LHS
+  475245878U,  // <u,2,3,4>: Cost 1 vsldoi4 LHS, RHS
+  1596764164U, // <u,2,3,5>: Cost 2 vsldoi4 LHS, <5,5,5,5>
+  1596764666U, // <u,2,3,6>: Cost 2 vsldoi4 LHS, <6,2,7,3>
+  1596765178U, // <u,2,3,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
+  135495787U,  // <u,2,3,u>: Cost 1 vmrglw LHS, LHS
+  2708851630U, // <u,2,4,0>: Cost 3 vsldoi8 <4,0,u,2>, <4,0,u,2>
+  2217362979U, // <u,2,4,1>: Cost 3 vmrghw <0,4,1,5>, <2,1,3,5>
+  2289624680U, // <u,2,4,2>: Cost 3 vmrglw <1,2,u,4>, <2,2,2,2>
+  1215881318U, // <u,2,4,3>: Cost 2 vmrglw <1,2,u,4>, LHS
+  2726767824U, // <u,2,4,4>: Cost 3 vsldoi8 <7,0,u,2>, <4,4,4,4>
+  1629138230U, // <u,2,4,5>: Cost 2 vsldoi8 <3,0,u,2>, RHS
+  2779178801U, // <u,2,4,6>: Cost 3 vsldoi12 RHS, <2,4,6,5>
+  2726251976U, // <u,2,4,7>: Cost 3 vsldoi8 <7,0,1,2>, <4,7,5,0>
+  1215881323U, // <u,2,4,u>: Cost 2 vmrglw <1,2,u,4>, LHS
+  2628714598U, // <u,2,5,0>: Cost 3 vsldoi4 <1,u,2,5>, LHS
+  2628715896U, // <u,2,5,1>: Cost 3 vsldoi4 <1,u,2,5>, <1,u,2,5>
+  1192445544U, // <u,2,5,2>: Cost 2 vmrghw RHS, <2,2,2,2>
+  1213898854U, // <u,2,5,3>: Cost 2 vmrglw <0,u,u,5>, LHS
+  2628717878U, // <u,2,5,4>: Cost 3 vsldoi4 <1,u,2,5>, RHS
+  2726768644U, // <u,2,5,5>: Cost 3 vsldoi8 <7,0,u,2>, <5,5,5,5>
+  1192445882U, // <u,2,5,6>: Cost 2 vmrghw RHS, <2,6,3,7>
+  2266187754U, // <u,2,5,7>: Cost 3 vmrghw RHS, <2,7,0,1>
+  1213898859U, // <u,2,5,u>: Cost 2 vmrglw <0,u,u,5>, LHS
+  2634694758U, // <u,2,6,0>: Cost 3 vsldoi4 <2,u,2,6>, LHS
+  2721460657U, // <u,2,6,1>: Cost 3 vsldoi8 <6,1,u,2>, <6,1,u,2>
+  2296940136U, // <u,2,6,2>: Cost 3 vmrglw <2,4,u,6>, <2,2,2,2>
+  1678600122U, // <u,2,6,3>: Cost 2 vsldoi12 LHS, <2,6,3,7>
+  2634698038U, // <u,2,6,4>: Cost 3 vsldoi4 <2,u,2,6>, RHS
   3370682125U, // <u,2,6,5>: Cost 4 vmrglw <2,4,u,6>, <2,4,2,5>
-  2230798266U, // <u,2,6,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
-  3799184279U, // <u,2,6,7>: Cost 3 vsldoi8 <6,7,u,2>, <6,7,u,2>
-  2752341991U, // <u,2,6,u>: Cost 2 vsldoi12 LHS, <2,6,u,7>
-  2726769721U, // <u,2,7,0>: Cost 2 vsldoi8 <7,0,u,2>, <7,0,u,2>
-  3383296748U, // <u,2,7,1>: Cost 3 vmrglw RHS, <1,0,2,1>
-  2309555816U, // <u,2,7,2>: Cost 2 vmrglw RHS, <2,2,2,2>
-  1235812454U, // <u,2,7,3>: Cost 1 vmrglw RHS, LHS
-  3708448054U, // <u,2,7,4>: Cost 3 vsldoi4 <2,u,2,7>, RHS
-  3383297076U, // <u,2,7,5>: Cost 3 vmrglw RHS, <1,4,2,5>
-  3383297725U, // <u,2,7,6>: Cost 3 vmrglw RHS, <2,3,2,6>
-  3383297240U, // <u,2,7,7>: Cost 3 vmrglw RHS, <1,6,2,7>
-  1235812459U, // <u,2,7,u>: Cost 1 vmrglw RHS, LHS
-  1549025954U, // <u,2,u,0>: Cost 1 vsldoi4 LHS, LHS
-  2622767924U, // <u,2,u,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
-  1410121830U, // <u,2,u,2>: Cost 1 vspltisw2 LHS
-  1209278566U, // <u,2,u,3>: Cost 1 vmrglw LHS, LHS
-  1549028662U, // <u,2,u,4>: Cost 1 vsldoi4 LHS, RHS
-  2702882970U, // <u,2,u,5>: Cost 2 vsldoi8 <3,0,u,2>, RHS
-  2267850682U, // <u,2,u,6>: Cost 2 vmrghw LHS, <2,6,3,7>
-  2670547962U, // <u,2,u,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
-  1209278571U, // <u,2,u,u>: Cost 1 vmrglw LHS, LHS
-  2685632512U, // <u,3,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
-  1611890844U, // <u,3,0,1>: Cost 1 vsldoi8 LHS, LHS
-  3759374509U, // <u,3,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
-  3759374588U, // <u,3,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
-  2685632850U, // <u,3,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
-  3807150546U, // <u,3,0,5>: Cost 3 vsldoi8 LHS, <0,5,6,7>
-  3732353977U, // <u,3,0,6>: Cost 3 vsldoi4 <6,u,3,0>, <6,u,3,0>
-  3363334074U, // <u,3,0,7>: Cost 3 vmrglw <1,2,u,0>, <2,6,3,7>
-  1611891357U, // <u,3,0,u>: Cost 1 vsldoi8 LHS, LHS
-  2263206038U, // <u,3,1,0>: Cost 2 vmrghw LHS, <3,0,1,2>
-  2685633332U, // <u,3,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
-  2685633430U, // <u,3,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
-  2263206300U, // <u,3,1,3>: Cost 2 vmrghw LHS, <3,3,3,3>
-  2263206402U, // <u,3,1,4>: Cost 2 vmrghw LHS, <3,4,5,6>
-  3764020335U, // <u,3,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
-  3764020431U, // <u,3,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
-  3361351610U, // <u,3,1,7>: Cost 3 vmrglw <0,u,u,1>, <2,6,3,7>
-  2685633916U, // <u,3,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
-  3759375866U, // <u,3,2,0>: Cost 3 vsldoi8 LHS, <2,0,u,0>
-  3759375903U, // <u,3,2,1>: Cost 3 vsldoi8 LHS, <2,1,3,1>
-  2685634152U, // <u,3,2,2>: Cost 2 vsldoi8 LHS, <2,2,2,2>
-  2685634214U, // <u,3,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
-  3759376195U, // <u,3,2,4>: Cost 3 vsldoi8 LHS, <2,4,u,5>
-  3759376277U, // <u,3,2,5>: Cost 3 vsldoi8 LHS, <2,5,u,6>
-  2685634490U, // <u,3,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
-  3373967290U, // <u,3,2,7>: Cost 3 vmrglw <3,0,u,2>, <2,6,3,7>
-  2685634619U, // <u,3,2,u>: Cost 2 vsldoi8 LHS, <2,u,0,1>
-  2282980246U, // <u,3,3,0>: Cost 2 vmrglw LHS, <1,2,3,0>
-  3356722071U, // <u,3,3,1>: Cost 3 vmrglw LHS, <1,2,3,1>
-  2634745944U, // <u,3,3,2>: Cost 2 vsldoi4 <2,u,3,3>, <2,u,3,3>
-  1477230694U, // <u,3,3,3>: Cost 1 vspltisw3 LHS
-  2282980250U, // <u,3,3,4>: Cost 2 vmrglw LHS, <1,2,3,4>
-  3356722723U, // <u,3,3,5>: Cost 3 vmrglw LHS, <2,1,3,5>
-  3356727422U, // <u,3,3,6>: Cost 3 vmrglw LHS, <u,5,3,6>
-  2282981306U, // <u,3,3,7>: Cost 2 vmrglw LHS, <2,6,3,7>
-  1477230694U, // <u,3,3,u>: Cost 1 vspltisw3 LHS
-  2628780134U, // <u,3,4,0>: Cost 2 vsldoi4 <1,u,3,4>, LHS
-  2628781440U, // <u,3,4,1>: Cost 2 vsldoi4 <1,u,3,4>, <1,u,3,4>
-  3702523496U, // <u,3,4,2>: Cost 3 vsldoi4 <1,u,3,4>, <2,2,2,2>
-  3363366514U, // <u,3,4,3>: Cost 3 vmrglw <1,2,u,4>, <2,2,3,3>
-  2628783414U, // <u,3,4,4>: Cost 2 vsldoi4 <1,u,3,4>, RHS
-  1611894070U, // <u,3,4,5>: Cost 1 vsldoi8 LHS, RHS
-  3732386749U, // <u,3,4,6>: Cost 3 vsldoi4 <6,u,3,4>, <6,u,3,4>
-  3363366842U, // <u,3,4,7>: Cost 3 vmrglw <1,2,u,4>, <2,6,3,7>
-  1611894313U, // <u,3,4,u>: Cost 1 vsldoi8 LHS, RHS
-  2266187926U, // <u,3,5,0>: Cost 2 vmrghw RHS, <3,0,1,2>
-  3807153807U, // <u,3,5,1>: Cost 3 vsldoi8 LHS, <5,1,0,1>
-  3708504154U, // <u,3,5,2>: Cost 3 vsldoi4 <2,u,3,5>, <2,u,3,5>
-  2266188188U, // <u,3,5,3>: Cost 2 vmrghw RHS, <3,3,3,3>
-  2266188290U, // <u,3,5,4>: Cost 2 vmrghw RHS, <3,4,5,6>
-  2733412356U, // <u,3,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
-  2733412450U, // <u,3,5,6>: Cost 2 vsldoi8 LHS, <5,6,7,0>
-  3361384378U, // <u,3,5,7>: Cost 3 vmrglw <0,u,u,5>, <2,6,3,7>
-  2733412612U, // <u,3,5,u>: Cost 2 vsldoi8 LHS, <5,u,7,0>
-  3708510310U, // <u,3,6,0>: Cost 3 vsldoi4 <2,u,3,6>, LHS
-  3807154599U, // <u,3,6,1>: Cost 3 vsldoi8 LHS, <6,1,7,1>
-  2722132483U, // <u,3,6,2>: Cost 2 vsldoi8 <6,2,u,3>, <6,2,u,3>
-  3708512797U, // <u,3,6,3>: Cost 3 vsldoi4 <2,u,3,6>, <3,4,u,6>
-  3708513590U, // <u,3,6,4>: Cost 3 vsldoi4 <2,u,3,6>, RHS
-  3807154923U, // <u,3,6,5>: Cost 3 vsldoi8 LHS, <6,5,7,1>
-  2733413176U, // <u,3,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
-  2733413198U, // <u,3,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
-  2726114281U, // <u,3,6,u>: Cost 2 vsldoi8 <6,u,u,3>, <6,u,u,3>
-  2634776678U, // <u,3,7,0>: Cost 2 vsldoi4 <2,u,3,7>, LHS
-  3708519220U, // <u,3,7,1>: Cost 3 vsldoi4 <2,u,3,7>, <1,1,1,1>
-  2634778716U, // <u,3,7,2>: Cost 2 vsldoi4 <2,u,3,7>, <2,u,3,7>
-  2309555826U, // <u,3,7,3>: Cost 2 vmrglw RHS, <2,2,3,3>
-  2634779958U, // <u,3,7,4>: Cost 2 vsldoi4 <2,u,3,7>, RHS
-  3383297571U, // <u,3,7,5>: Cost 3 vmrglw RHS, <2,1,3,5>
-  3383297896U, // <u,3,7,6>: Cost 3 vmrglw RHS, <2,5,3,6>
-  2309556154U, // <u,3,7,7>: Cost 2 vmrglw RHS, <2,6,3,7>
-  2634782510U, // <u,3,7,u>: Cost 2 vsldoi4 <2,u,3,7>, LHS
-  2685638355U, // <u,3,u,0>: Cost 2 vsldoi8 LHS, <u,0,1,2>
-  1611896622U, // <u,3,u,1>: Cost 1 vsldoi8 LHS, LHS
-  2685638536U, // <u,3,u,2>: Cost 2 vsldoi8 LHS, <u,2,3,3>
-  1477230694U, // <u,3,u,3>: Cost 1 vspltisw3 LHS
-  2685638719U, // <u,3,u,4>: Cost 2 vsldoi8 LHS, <u,4,5,6>
-  1611896986U, // <u,3,u,5>: Cost 1 vsldoi8 LHS, RHS
-  2685638864U, // <u,3,u,6>: Cost 2 vsldoi8 LHS, <u,6,3,7>
-  2283022266U, // <u,3,u,7>: Cost 2 vmrglw LHS, <2,6,3,7>
-  1611897189U, // <u,3,u,u>: Cost 1 vsldoi8 LHS, LHS
-  2238860178U, // <u,4,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
-  2692276326U, // <u,4,0,1>: Cost 2 vsldoi8 <1,2,u,4>, LHS
-  3708536926U, // <u,4,0,2>: Cost 3 vsldoi4 <2,u,4,0>, <2,u,4,0>
-  3760193792U, // <u,4,0,3>: Cost 3 vsldoi8 <0,3,1,4>, <0,3,1,4>
-  3766018386U, // <u,4,0,4>: Cost 3 vsldoi8 <1,2,u,4>, <0,4,1,5>
-  2779179922U, // <u,4,0,5>: Cost 2 vsldoi12 RHS, <4,0,5,1>
-  3732427714U, // <u,4,0,6>: Cost 3 vsldoi4 <6,u,4,0>, <6,u,4,0>
-  3330231752U, // <u,4,0,7>: Cost 3 vmrghw <7,0,1,2>, <4,7,5,0>
-  2692276893U, // <u,4,0,u>: Cost 2 vsldoi8 <1,2,u,4>, LHS
-  2263206802U, // <u,4,1,0>: Cost 2 vmrghw LHS, <4,0,5,1>
-  3766018868U, // <u,4,1,1>: Cost 3 vsldoi8 <1,2,u,4>, <1,1,1,1>
-  2692277191U, // <u,4,1,2>: Cost 2 vsldoi8 <1,2,u,4>, <1,2,u,4>
-  3714517816U, // <u,4,1,3>: Cost 3 vsldoi4 <3,u,4,1>, <3,u,4,1>
-  2263207120U, // <u,4,1,4>: Cost 2 vmrghw LHS, <4,4,4,4>
-  1189465398U, // <u,4,1,5>: Cost 1 vmrghw LHS, RHS
-  3336949113U, // <u,4,1,6>: Cost 3 vmrghw LHS, <4,6,5,2>
-  3738408604U, // <u,4,1,7>: Cost 3 vsldoi4 <7,u,4,1>, <7,u,4,1>
-  1189465641U, // <u,4,1,u>: Cost 1 vmrghw LHS, RHS
-  3337661330U, // <u,4,2,0>: Cost 3 vmrghw <u,2,3,0>, <4,0,5,1>
-  3295857636U, // <u,4,2,1>: Cost 3 vmrghw <1,2,3,0>, <4,1,5,2>
-  3766019688U, // <u,4,2,2>: Cost 3 vsldoi8 <1,2,u,4>, <2,2,2,2>
-  3766019750U, // <u,4,2,3>: Cost 3 vsldoi8 <1,2,u,4>, <2,3,0,1>
-  3397856464U, // <u,4,2,4>: Cost 3 vmrglw <7,0,u,2>, <4,4,4,4>
-  2263919926U, // <u,4,2,5>: Cost 2 vmrghw <u,2,3,0>, RHS
-  3766020026U, // <u,4,2,6>: Cost 3 vsldoi8 <1,2,u,4>, <2,6,3,7>
-  3775309877U, // <u,4,2,7>: Cost 3 vsldoi8 <2,7,u,4>, <2,7,u,4>
-  2263920169U, // <u,4,2,u>: Cost 2 vmrghw <u,2,3,0>, RHS
-  3766020246U, // <u,4,3,0>: Cost 3 vsldoi8 <1,2,u,4>, <3,0,1,2>
-  3356723376U, // <u,4,3,1>: Cost 3 vmrglw LHS, <3,0,4,1>
-  3777964409U, // <u,4,3,2>: Cost 3 vsldoi8 <3,2,u,4>, <3,2,u,4>
-  3766020508U, // <u,4,3,3>: Cost 3 vsldoi8 <1,2,u,4>, <3,3,3,3>
-  2330758352U, // <u,4,3,4>: Cost 2 vmrglw LHS, <4,4,4,4>
-  2282981070U, // <u,4,3,5>: Cost 2 vmrglw LHS, <2,3,4,5>
-  3765652124U, // <u,4,3,6>: Cost 3 vsldoi8 <1,2,3,4>, <3,6,4,7>
-  3738424990U, // <u,4,3,7>: Cost 3 vsldoi4 <7,u,4,3>, <7,u,4,3>
-  2282981073U, // <u,4,3,u>: Cost 2 vmrglw LHS, <2,3,4,u>
-  2646769766U, // <u,4,4,0>: Cost 2 vsldoi4 <4,u,4,4>, LHS
-  3708568519U, // <u,4,4,1>: Cost 3 vsldoi4 <2,u,4,4>, <1,2,u,4>
-  3708569698U, // <u,4,4,2>: Cost 3 vsldoi4 <2,u,4,4>, <2,u,4,4>
-  3363370897U, // <u,4,4,3>: Cost 3 vmrglw <1,2,u,4>, <u,2,4,3>
-  1302777142U, // <u,4,4,4>: Cost 1 vspltisw0 RHS
-  2692279606U, // <u,4,4,5>: Cost 2 vsldoi8 <1,2,u,4>, RHS
-  3732460486U, // <u,4,4,6>: Cost 3 vsldoi4 <6,u,4,4>, <6,u,4,4>
-  3363371225U, // <u,4,4,7>: Cost 3 vmrglw <1,2,u,4>, <u,6,4,7>
-  1302777142U, // <u,4,4,u>: Cost 1 vspltisw0 RHS
-  2634834022U, // <u,4,5,0>: Cost 2 vsldoi4 <2,u,4,5>, LHS
-  3702605194U, // <u,4,5,1>: Cost 3 vsldoi4 <1,u,4,5>, <1,u,4,5>
-  2634836067U, // <u,4,5,2>: Cost 2 vsldoi4 <2,u,4,5>, <2,u,4,5>
-  3708577942U, // <u,4,5,3>: Cost 3 vsldoi4 <2,u,4,5>, <3,0,1,2>
-  2634837302U, // <u,4,5,4>: Cost 2 vsldoi4 <2,u,4,5>, RHS
-  1192447286U, // <u,4,5,5>: Cost 1 vmrghw RHS, RHS
-  1678601526U, // <u,4,5,6>: Cost 1 vsldoi12 LHS, RHS
-  3732468730U, // <u,4,5,7>: Cost 3 vsldoi4 <6,u,4,5>, <7,0,1,2>
-  1678601544U, // <u,4,5,u>: Cost 1 vsldoi12 LHS, RHS
-  3340372882U, // <u,4,6,0>: Cost 3 vmrghw <u,6,3,7>, <4,0,5,1>
-  3376433976U, // <u,4,6,1>: Cost 3 vmrglw <3,4,5,6>, <3,u,4,1>
-  3792564730U, // <u,4,6,2>: Cost 3 vsldoi8 <5,6,u,4>, <6,2,7,3>
-  3796546133U, // <u,4,6,3>: Cost 3 vsldoi8 <6,3,u,4>, <6,3,u,4>
-  3797209766U, // <u,4,6,4>: Cost 3 vsldoi8 <6,4,u,4>, <6,4,u,4>
-  2266631478U, // <u,4,6,5>: Cost 2 vmrghw <u,6,3,7>, RHS
-  3792565048U, // <u,4,6,6>: Cost 3 vsldoi8 <5,6,u,4>, <6,6,6,6>
-  3792565070U, // <u,4,6,7>: Cost 3 vsldoi8 <5,6,u,4>, <6,7,0,1>
-  2266631721U, // <u,4,6,u>: Cost 2 vmrghw <u,6,3,7>, RHS
-  3714564198U, // <u,4,7,0>: Cost 3 vsldoi4 <3,u,4,7>, LHS
-  3714565018U, // <u,4,7,1>: Cost 3 vsldoi4 <3,u,4,7>, <1,2,3,4>
-  3801855197U, // <u,4,7,2>: Cost 3 vsldoi8 <7,2,u,4>, <7,2,u,4>
-  3714566974U, // <u,4,7,3>: Cost 3 vsldoi4 <3,u,4,7>, <3,u,4,7>
-  2309557456U, // <u,4,7,4>: Cost 2 vmrglw RHS, <4,4,4,4>
-  2309555918U, // <u,4,7,5>: Cost 2 vmrglw RHS, <2,3,4,5>
-  3804509729U, // <u,4,7,6>: Cost 3 vsldoi8 <7,6,u,4>, <7,6,u,4>
-  3383298716U, // <u,4,7,7>: Cost 3 vmrglw RHS, <3,6,4,7>
-  2309555921U, // <u,4,7,u>: Cost 2 vmrglw RHS, <2,3,4,u>
-  2634858598U, // <u,4,u,0>: Cost 2 vsldoi4 <2,u,4,u>, LHS
-  2692282158U, // <u,4,u,1>: Cost 2 vsldoi8 <1,2,u,4>, LHS
-  2634860646U, // <u,4,u,2>: Cost 2 vsldoi4 <2,u,4,u>, <2,u,4,u>
-  3766024124U, // <u,4,u,3>: Cost 3 vsldoi8 <1,2,u,4>, <u,3,0,1>
-  1302777142U, // <u,4,u,4>: Cost 1 vspltisw0 RHS
-  1194110262U, // <u,4,u,5>: Cost 1 vmrghw LHS, RHS
-  1678601769U, // <u,4,u,6>: Cost 1 vsldoi12 LHS, RHS
-  3383306908U, // <u,4,u,7>: Cost 3 vmrglw RHS, <3,6,4,7>
-  1678601787U, // <u,4,u,u>: Cost 1 vsldoi12 LHS, RHS
-  3764035584U, // <u,5,0,0>: Cost 3 vsldoi8 <0,u,u,5>, <0,0,0,0>
-  2690293862U, // <u,5,0,1>: Cost 2 vsldoi8 <0,u,u,5>, LHS
-  3714582258U, // <u,5,0,2>: Cost 3 vsldoi4 <3,u,5,0>, <2,3,u,5>
-  3714583360U, // <u,5,0,3>: Cost 3 vsldoi4 <3,u,5,0>, <3,u,5,0>
-  2687123794U, // <u,5,0,4>: Cost 2 vsldoi8 <0,4,1,5>, <0,4,1,5>
-  3389877466U, // <u,5,0,5>: Cost 3 vmrglw <5,6,u,0>, <4,4,5,5>
-  3363334658U, // <u,5,0,6>: Cost 3 vmrglw <1,2,u,0>, <3,4,5,6>
-  3738474148U, // <u,5,0,7>: Cost 3 vsldoi4 <7,u,5,0>, <7,u,5,0>
-  2690294485U, // <u,5,0,u>: Cost 2 vsldoi8 <0,u,u,5>, <0,u,u,5>
-  2646818918U, // <u,5,1,0>: Cost 2 vsldoi4 <4,u,5,1>, LHS
-  2311278106U, // <u,5,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
-  3764036502U, // <u,5,1,2>: Cost 3 vsldoi8 <0,u,u,5>, <1,2,3,0>
-  3720562838U, // <u,5,1,3>: Cost 3 vsldoi4 <4,u,5,1>, <3,0,1,2>
-  2646822426U, // <u,5,1,4>: Cost 2 vsldoi4 <4,u,5,1>, <4,u,5,1>
-  2263207940U, // <u,5,1,5>: Cost 2 vmrghw LHS, <5,5,5,5>
-  2263208034U, // <u,5,1,6>: Cost 2 vmrghw LHS, <5,6,7,0>
-  3720565754U, // <u,5,1,7>: Cost 3 vsldoi4 <4,u,5,1>, <7,0,1,2>
-  2646824750U, // <u,5,1,u>: Cost 2 vsldoi4 <4,u,5,1>, LHS
-  3714596966U, // <u,5,2,0>: Cost 3 vsldoi4 <3,u,5,2>, LHS
-  3771336272U, // <u,5,2,1>: Cost 3 vsldoi8 <2,1,u,5>, <2,1,u,5>
-  3764037224U, // <u,5,2,2>: Cost 3 vsldoi8 <0,u,u,5>, <2,2,2,2>
-  2698921714U, // <u,5,2,3>: Cost 2 vsldoi8 <2,3,u,5>, <2,3,u,5>
-  3773327171U, // <u,5,2,4>: Cost 3 vsldoi8 <2,4,u,5>, <2,4,u,5>
-  3854913295U, // <u,5,2,5>: Cost 3 vsldoi12 RHS, <5,2,5,3>
-  3764037562U, // <u,5,2,6>: Cost 3 vsldoi8 <0,u,u,5>, <2,6,3,7>
+  1157056442U, // <u,2,6,6>: Cost 2 vmrghw <2,6,3,7>, <2,6,3,7>
+  2725442455U, // <u,2,6,7>: Cost 3 vsldoi8 <6,7,u,2>, <6,7,u,2>
+  1678600167U, // <u,2,6,u>: Cost 2 vsldoi12 LHS, <2,6,u,7>
+  1653027897U, // <u,2,7,0>: Cost 2 vsldoi8 <7,0,u,2>, <7,0,u,2>
+  2309554924U, // <u,2,7,1>: Cost 3 vmrglw RHS, <1,0,2,1>
+  1235813992U, // <u,2,7,2>: Cost 2 vmrglw RHS, <2,2,2,2>
+  162070630U,  // <u,2,7,3>: Cost 1 vmrglw RHS, LHS
+  2634706230U, // <u,2,7,4>: Cost 3 vsldoi4 <2,u,2,7>, RHS
+  2309555252U, // <u,2,7,5>: Cost 3 vmrglw RHS, <1,4,2,5>
+  2309555901U, // <u,2,7,6>: Cost 3 vmrglw RHS, <2,3,2,6>
+  2309555416U, // <u,2,7,7>: Cost 3 vmrglw RHS, <1,6,2,7>
+  162070635U,  // <u,2,7,u>: Cost 1 vmrglw RHS, LHS
+  475284130U,  // <u,2,u,0>: Cost 1 vsldoi4 LHS, LHS
+  1549026100U, // <u,2,u,1>: Cost 2 vsldoi4 LHS, <1,1,1,1>
+  336380006U,  // <u,2,u,2>: Cost 1 vspltisw2 LHS
+  135536742U,  // <u,2,u,3>: Cost 1 vmrglw LHS, LHS
+  475286838U,  // <u,2,u,4>: Cost 1 vsldoi4 LHS, RHS
+  1629141146U, // <u,2,u,5>: Cost 2 vsldoi8 <3,0,u,2>, RHS
+  1194108858U, // <u,2,u,6>: Cost 2 vmrghw LHS, <2,6,3,7>
+  1596806138U, // <u,2,u,7>: Cost 2 vsldoi4 LHS, <7,0,1,2>
+  135536747U,  // <u,2,u,u>: Cost 1 vmrglw LHS, LHS
+  1611890688U, // <u,3,0,0>: Cost 2 vsldoi8 LHS, <0,0,0,0>
+  538149020U,  // <u,3,0,1>: Cost 1 vsldoi8 LHS, LHS
+  2685632685U, // <u,3,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
+  2685632764U, // <u,3,0,3>: Cost 3 vsldoi8 LHS, <0,3,1,0>
+  1611891026U, // <u,3,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
+  2733408722U, // <u,3,0,5>: Cost 3 vsldoi8 LHS, <0,5,6,7>
+  2658612153U, // <u,3,0,6>: Cost 3 vsldoi4 <6,u,3,0>, <6,u,3,0>
+  2289592250U, // <u,3,0,7>: Cost 3 vmrglw <1,2,u,0>, <2,6,3,7>
+  538149533U,  // <u,3,0,u>: Cost 1 vsldoi8 LHS, LHS
+  1189464214U, // <u,3,1,0>: Cost 2 vmrghw LHS, <3,0,1,2>
+  1611891508U, // <u,3,1,1>: Cost 2 vsldoi8 LHS, <1,1,1,1>
+  1611891606U, // <u,3,1,2>: Cost 2 vsldoi8 LHS, <1,2,3,0>
+  1189464476U, // <u,3,1,3>: Cost 2 vmrghw LHS, <3,3,3,3>
+  1189464578U, // <u,3,1,4>: Cost 2 vmrghw LHS, <3,4,5,6>
+  2690278511U, // <u,3,1,5>: Cost 3 vsldoi8 LHS, <1,5,0,1>
+  2690278607U, // <u,3,1,6>: Cost 3 vsldoi8 LHS, <1,6,1,7>
+  2287609786U, // <u,3,1,7>: Cost 3 vmrglw <0,u,u,1>, <2,6,3,7>
+  1611892092U, // <u,3,1,u>: Cost 2 vsldoi8 LHS, <1,u,3,0>
+  2685634042U, // <u,3,2,0>: Cost 3 vsldoi8 LHS, <2,0,u,0>
+  2685634079U, // <u,3,2,1>: Cost 3 vsldoi8 LHS, <2,1,3,1>
+  1611892328U, // <u,3,2,2>: Cost 2 vsldoi8 LHS, <2,2,2,2>
+  1611892390U, // <u,3,2,3>: Cost 2 vsldoi8 LHS, <2,3,0,1>
+  2685634371U, // <u,3,2,4>: Cost 3 vsldoi8 LHS, <2,4,u,5>
+  2685634453U, // <u,3,2,5>: Cost 3 vsldoi8 LHS, <2,5,u,6>
+  1611892666U, // <u,3,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
+  2300225466U, // <u,3,2,7>: Cost 3 vmrglw <3,0,u,2>, <2,6,3,7>
+  1611892795U, // <u,3,2,u>: Cost 2 vsldoi8 LHS, <2,u,0,1>
+  1209238422U, // <u,3,3,0>: Cost 2 vmrglw LHS, <1,2,3,0>
+  2282980247U, // <u,3,3,1>: Cost 3 vmrglw LHS, <1,2,3,1>
+  1561004120U, // <u,3,3,2>: Cost 2 vsldoi4 <2,u,3,3>, <2,u,3,3>
+  403488870U,  // <u,3,3,3>: Cost 1 vspltisw3 LHS
+  1209238426U, // <u,3,3,4>: Cost 2 vmrglw LHS, <1,2,3,4>
+  2282980899U, // <u,3,3,5>: Cost 3 vmrglw LHS, <2,1,3,5>
+  2282985598U, // <u,3,3,6>: Cost 3 vmrglw LHS, <u,5,3,6>
+  1209239482U, // <u,3,3,7>: Cost 2 vmrglw LHS, <2,6,3,7>
+  403488870U,  // <u,3,3,u>: Cost 1 vspltisw3 LHS
+  1555038310U, // <u,3,4,0>: Cost 2 vsldoi4 <1,u,3,4>, LHS
+  1555039616U, // <u,3,4,1>: Cost 2 vsldoi4 <1,u,3,4>, <1,u,3,4>
+  2628781672U, // <u,3,4,2>: Cost 3 vsldoi4 <1,u,3,4>, <2,2,2,2>
+  2289624690U, // <u,3,4,3>: Cost 3 vmrglw <1,2,u,4>, <2,2,3,3>
+  1555041590U, // <u,3,4,4>: Cost 2 vsldoi4 <1,u,3,4>, RHS
+  538152246U,  // <u,3,4,5>: Cost 1 vsldoi8 LHS, RHS
+  2658644925U, // <u,3,4,6>: Cost 3 vsldoi4 <6,u,3,4>, <6,u,3,4>
+  2289625018U, // <u,3,4,7>: Cost 3 vmrglw <1,2,u,4>, <2,6,3,7>
+  538152489U,  // <u,3,4,u>: Cost 1 vsldoi8 LHS, RHS
+  1192446102U, // <u,3,5,0>: Cost 2 vmrghw RHS, <3,0,1,2>
+  2733411983U, // <u,3,5,1>: Cost 3 vsldoi8 LHS, <5,1,0,1>
+  2634762330U, // <u,3,5,2>: Cost 3 vsldoi4 <2,u,3,5>, <2,u,3,5>
+  1192446364U, // <u,3,5,3>: Cost 2 vmrghw RHS, <3,3,3,3>
+  1192446466U, // <u,3,5,4>: Cost 2 vmrghw RHS, <3,4,5,6>
+  1659670532U, // <u,3,5,5>: Cost 2 vsldoi8 LHS, <5,5,5,5>
+  1659670626U, // <u,3,5,6>: Cost 2 vsldoi8 LHS, <5,6,7,0>
+  2287642554U, // <u,3,5,7>: Cost 3 vmrglw <0,u,u,5>, <2,6,3,7>
+  1659670788U, // <u,3,5,u>: Cost 2 vsldoi8 LHS, <5,u,7,0>
+  2634768486U, // <u,3,6,0>: Cost 3 vsldoi4 <2,u,3,6>, LHS
+  2733412775U, // <u,3,6,1>: Cost 3 vsldoi8 LHS, <6,1,7,1>
+  1648390659U, // <u,3,6,2>: Cost 2 vsldoi8 <6,2,u,3>, <6,2,u,3>
+  2634770973U, // <u,3,6,3>: Cost 3 vsldoi4 <2,u,3,6>, <3,4,u,6>
+  2634771766U, // <u,3,6,4>: Cost 3 vsldoi4 <2,u,3,6>, RHS
+  2733413099U, // <u,3,6,5>: Cost 3 vsldoi8 LHS, <6,5,7,1>
+  1659671352U, // <u,3,6,6>: Cost 2 vsldoi8 LHS, <6,6,6,6>
+  1659671374U, // <u,3,6,7>: Cost 2 vsldoi8 LHS, <6,7,0,1>
+  1652372457U, // <u,3,6,u>: Cost 2 vsldoi8 <6,u,u,3>, <6,u,u,3>
+  1561034854U, // <u,3,7,0>: Cost 2 vsldoi4 <2,u,3,7>, LHS
+  2634777396U, // <u,3,7,1>: Cost 3 vsldoi4 <2,u,3,7>, <1,1,1,1>
+  1561036892U, // <u,3,7,2>: Cost 2 vsldoi4 <2,u,3,7>, <2,u,3,7>
+  1235814002U, // <u,3,7,3>: Cost 2 vmrglw RHS, <2,2,3,3>
+  1561038134U, // <u,3,7,4>: Cost 2 vsldoi4 <2,u,3,7>, RHS
+  2309555747U, // <u,3,7,5>: Cost 3 vmrglw RHS, <2,1,3,5>
+  2309556072U, // <u,3,7,6>: Cost 3 vmrglw RHS, <2,5,3,6>
+  1235814330U, // <u,3,7,7>: Cost 2 vmrglw RHS, <2,6,3,7>
+  1561040686U, // <u,3,7,u>: Cost 2 vsldoi4 <2,u,3,7>, LHS
+  1611896531U, // <u,3,u,0>: Cost 2 vsldoi8 LHS, <u,0,1,2>
+  538154798U,  // <u,3,u,1>: Cost 1 vsldoi8 LHS, LHS
+  1611896712U, // <u,3,u,2>: Cost 2 vsldoi8 LHS, <u,2,3,3>
+  403488870U,  // <u,3,u,3>: Cost 1 vspltisw3 LHS
+  1611896895U, // <u,3,u,4>: Cost 2 vsldoi8 LHS, <u,4,5,6>
+  538155162U,  // <u,3,u,5>: Cost 1 vsldoi8 LHS, RHS
+  1611897040U, // <u,3,u,6>: Cost 2 vsldoi8 LHS, <u,6,3,7>
+  1209280442U, // <u,3,u,7>: Cost 2 vmrglw LHS, <2,6,3,7>
+  538155365U,  // <u,3,u,u>: Cost 1 vsldoi8 LHS, LHS
+  1165118354U, // <u,4,0,0>: Cost 2 vmrghw <4,0,5,1>, <4,0,5,1>
+  1618534502U, // <u,4,0,1>: Cost 2 vsldoi8 <1,2,u,4>, LHS
+  2634795102U, // <u,4,0,2>: Cost 3 vsldoi4 <2,u,4,0>, <2,u,4,0>
+  2686451968U, // <u,4,0,3>: Cost 3 vsldoi8 <0,3,1,4>, <0,3,1,4>
+  2692276562U, // <u,4,0,4>: Cost 3 vsldoi8 <1,2,u,4>, <0,4,1,5>
+  1705438098U, // <u,4,0,5>: Cost 2 vsldoi12 RHS, <4,0,5,1>
+  2658685890U, // <u,4,0,6>: Cost 3 vsldoi4 <6,u,4,0>, <6,u,4,0>
+  2256489928U, // <u,4,0,7>: Cost 3 vmrghw <7,0,1,2>, <4,7,5,0>
+  1618535069U, // <u,4,0,u>: Cost 2 vsldoi8 <1,2,u,4>, LHS
+  1189464978U, // <u,4,1,0>: Cost 2 vmrghw LHS, <4,0,5,1>
+  2692277044U, // <u,4,1,1>: Cost 3 vsldoi8 <1,2,u,4>, <1,1,1,1>
+  1618535367U, // <u,4,1,2>: Cost 2 vsldoi8 <1,2,u,4>, <1,2,u,4>
+  2640775992U, // <u,4,1,3>: Cost 3 vsldoi4 <3,u,4,1>, <3,u,4,1>
+  1189465296U, // <u,4,1,4>: Cost 2 vmrghw LHS, <4,4,4,4>
+  115723574U,  // <u,4,1,5>: Cost 1 vmrghw LHS, RHS
+  2263207289U, // <u,4,1,6>: Cost 3 vmrghw LHS, <4,6,5,2>
+  2664666780U, // <u,4,1,7>: Cost 3 vsldoi4 <7,u,4,1>, <7,u,4,1>
+  115723817U,  // <u,4,1,u>: Cost 1 vmrghw LHS, RHS
+  2263919506U, // <u,4,2,0>: Cost 3 vmrghw <u,2,3,0>, <4,0,5,1>
+  2222115812U, // <u,4,2,1>: Cost 3 vmrghw <1,2,3,0>, <4,1,5,2>
+  2692277864U, // <u,4,2,2>: Cost 3 vsldoi8 <1,2,u,4>, <2,2,2,2>
+  2692277926U, // <u,4,2,3>: Cost 3 vsldoi8 <1,2,u,4>, <2,3,0,1>
+  2324114640U, // <u,4,2,4>: Cost 3 vmrglw <7,0,u,2>, <4,4,4,4>
+  1190178102U, // <u,4,2,5>: Cost 2 vmrghw <u,2,3,0>, RHS
+  2692278202U, // <u,4,2,6>: Cost 3 vsldoi8 <1,2,u,4>, <2,6,3,7>
+  2701568053U, // <u,4,2,7>: Cost 3 vsldoi8 <2,7,u,4>, <2,7,u,4>
+  1190178345U, // <u,4,2,u>: Cost 2 vmrghw <u,2,3,0>, RHS
+  2692278422U, // <u,4,3,0>: Cost 3 vsldoi8 <1,2,u,4>, <3,0,1,2>
+  2282981552U, // <u,4,3,1>: Cost 3 vmrglw LHS, <3,0,4,1>
+  2704222585U, // <u,4,3,2>: Cost 3 vsldoi8 <3,2,u,4>, <3,2,u,4>
+  2692278684U, // <u,4,3,3>: Cost 3 vsldoi8 <1,2,u,4>, <3,3,3,3>
+  1257016528U, // <u,4,3,4>: Cost 2 vmrglw LHS, <4,4,4,4>
+  1209239246U, // <u,4,3,5>: Cost 2 vmrglw LHS, <2,3,4,5>
+  2691910300U, // <u,4,3,6>: Cost 3 vsldoi8 <1,2,3,4>, <3,6,4,7>
+  2664683166U, // <u,4,3,7>: Cost 3 vsldoi4 <7,u,4,3>, <7,u,4,3>
+  1209239249U, // <u,4,3,u>: Cost 2 vmrglw LHS, <2,3,4,u>
+  1573027942U, // <u,4,4,0>: Cost 2 vsldoi4 <4,u,4,4>, LHS
+  2634826695U, // <u,4,4,1>: Cost 3 vsldoi4 <2,u,4,4>, <1,2,u,4>
+  2634827874U, // <u,4,4,2>: Cost 3 vsldoi4 <2,u,4,4>, <2,u,4,4>
+  2289629073U, // <u,4,4,3>: Cost 3 vmrglw <1,2,u,4>, <u,2,4,3>
+  229035318U,  // <u,4,4,4>: Cost 1 vspltisw0 RHS
+  1618537782U, // <u,4,4,5>: Cost 2 vsldoi8 <1,2,u,4>, RHS
+  2658718662U, // <u,4,4,6>: Cost 3 vsldoi4 <6,u,4,4>, <6,u,4,4>
+  2289629401U, // <u,4,4,7>: Cost 3 vmrglw <1,2,u,4>, <u,6,4,7>
+  229035318U,  // <u,4,4,u>: Cost 1 vspltisw0 RHS
+  1561092198U, // <u,4,5,0>: Cost 2 vsldoi4 <2,u,4,5>, LHS
+  2628863370U, // <u,4,5,1>: Cost 3 vsldoi4 <1,u,4,5>, <1,u,4,5>
+  1561094243U, // <u,4,5,2>: Cost 2 vsldoi4 <2,u,4,5>, <2,u,4,5>
+  2634836118U, // <u,4,5,3>: Cost 3 vsldoi4 <2,u,4,5>, <3,0,1,2>
+  1561095478U, // <u,4,5,4>: Cost 2 vsldoi4 <2,u,4,5>, RHS
+  118705462U,  // <u,4,5,5>: Cost 1 vmrghw RHS, RHS
+  604859702U,  // <u,4,5,6>: Cost 1 vsldoi12 LHS, RHS
+  2658726906U, // <u,4,5,7>: Cost 3 vsldoi4 <6,u,4,5>, <7,0,1,2>
+  604859720U,  // <u,4,5,u>: Cost 1 vsldoi12 LHS, RHS
+  2266631058U, // <u,4,6,0>: Cost 3 vmrghw <u,6,3,7>, <4,0,5,1>
+  2302692152U, // <u,4,6,1>: Cost 3 vmrglw <3,4,5,6>, <3,u,4,1>
+  2718822906U, // <u,4,6,2>: Cost 3 vsldoi8 <5,6,u,4>, <6,2,7,3>
+  2722804309U, // <u,4,6,3>: Cost 3 vsldoi8 <6,3,u,4>, <6,3,u,4>
+  2723467942U, // <u,4,6,4>: Cost 3 vsldoi8 <6,4,u,4>, <6,4,u,4>
+  1192889654U, // <u,4,6,5>: Cost 2 vmrghw <u,6,3,7>, RHS
+  2718823224U, // <u,4,6,6>: Cost 3 vsldoi8 <5,6,u,4>, <6,6,6,6>
+  2718823246U, // <u,4,6,7>: Cost 3 vsldoi8 <5,6,u,4>, <6,7,0,1>
+  1192889897U, // <u,4,6,u>: Cost 2 vmrghw <u,6,3,7>, RHS
+  2640822374U, // <u,4,7,0>: Cost 3 vsldoi4 <3,u,4,7>, LHS
+  2640823194U, // <u,4,7,1>: Cost 3 vsldoi4 <3,u,4,7>, <1,2,3,4>
+  2728113373U, // <u,4,7,2>: Cost 3 vsldoi8 <7,2,u,4>, <7,2,u,4>
+  2640825150U, // <u,4,7,3>: Cost 3 vsldoi4 <3,u,4,7>, <3,u,4,7>
+  1235815632U, // <u,4,7,4>: Cost 2 vmrglw RHS, <4,4,4,4>
+  1235814094U, // <u,4,7,5>: Cost 2 vmrglw RHS, <2,3,4,5>
+  2730767905U, // <u,4,7,6>: Cost 3 vsldoi8 <7,6,u,4>, <7,6,u,4>
+  2309556892U, // <u,4,7,7>: Cost 3 vmrglw RHS, <3,6,4,7>
+  1235814097U, // <u,4,7,u>: Cost 2 vmrglw RHS, <2,3,4,u>
+  1561116774U, // <u,4,u,0>: Cost 2 vsldoi4 <2,u,4,u>, LHS
+  1618540334U, // <u,4,u,1>: Cost 2 vsldoi8 <1,2,u,4>, LHS
+  1561118822U, // <u,4,u,2>: Cost 2 vsldoi4 <2,u,4,u>, <2,u,4,u>
+  2692282300U, // <u,4,u,3>: Cost 3 vsldoi8 <1,2,u,4>, <u,3,0,1>
+  229035318U,  // <u,4,u,4>: Cost 1 vspltisw0 RHS
+  120368438U,  // <u,4,u,5>: Cost 1 vmrghw LHS, RHS
+  604859945U,  // <u,4,u,6>: Cost 1 vsldoi12 LHS, RHS
+  2309565084U, // <u,4,u,7>: Cost 3 vmrglw RHS, <3,6,4,7>
+  604859963U,  // <u,4,u,u>: Cost 1 vsldoi12 LHS, RHS
+  2690293760U, // <u,5,0,0>: Cost 3 vsldoi8 <0,u,u,5>, <0,0,0,0>
+  1616552038U, // <u,5,0,1>: Cost 2 vsldoi8 <0,u,u,5>, LHS
+  2640840434U, // <u,5,0,2>: Cost 3 vsldoi4 <3,u,5,0>, <2,3,u,5>
+  2640841536U, // <u,5,0,3>: Cost 3 vsldoi4 <3,u,5,0>, <3,u,5,0>
+  1613381970U, // <u,5,0,4>: Cost 2 vsldoi8 <0,4,1,5>, <0,4,1,5>
+  2316135642U, // <u,5,0,5>: Cost 3 vmrglw <5,6,u,0>, <4,4,5,5>
+  2289592834U, // <u,5,0,6>: Cost 3 vmrglw <1,2,u,0>, <3,4,5,6>
+  2664732324U, // <u,5,0,7>: Cost 3 vsldoi4 <7,u,5,0>, <7,u,5,0>
+  1616552661U, // <u,5,0,u>: Cost 2 vsldoi8 <0,u,u,5>, <0,u,u,5>
+  1573077094U, // <u,5,1,0>: Cost 2 vsldoi4 <4,u,5,1>, LHS
+  1237536282U, // <u,5,1,1>: Cost 2 vmrglw <4,u,5,1>, <4,u,5,1>
+  2690294678U, // <u,5,1,2>: Cost 3 vsldoi8 <0,u,u,5>, <1,2,3,0>
+  2646821014U, // <u,5,1,3>: Cost 3 vsldoi4 <4,u,5,1>, <3,0,1,2>
+  1573080602U, // <u,5,1,4>: Cost 2 vsldoi4 <4,u,5,1>, <4,u,5,1>
+  1189466116U, // <u,5,1,5>: Cost 2 vmrghw LHS, <5,5,5,5>
+  1189466210U, // <u,5,1,6>: Cost 2 vmrghw LHS, <5,6,7,0>
+  2646823930U, // <u,5,1,7>: Cost 3 vsldoi4 <4,u,5,1>, <7,0,1,2>
+  1573082926U, // <u,5,1,u>: Cost 2 vsldoi4 <4,u,5,1>, LHS
+  2640855142U, // <u,5,2,0>: Cost 3 vsldoi4 <3,u,5,2>, LHS
+  2697594448U, // <u,5,2,1>: Cost 3 vsldoi8 <2,1,u,5>, <2,1,u,5>
+  2690295400U, // <u,5,2,2>: Cost 3 vsldoi8 <0,u,u,5>, <2,2,2,2>
+  1625179890U, // <u,5,2,3>: Cost 2 vsldoi8 <2,3,u,5>, <2,3,u,5>
+  2699585347U, // <u,5,2,4>: Cost 3 vsldoi8 <2,4,u,5>, <2,4,u,5>
+  2781171471U, // <u,5,2,5>: Cost 3 vsldoi12 RHS, <5,2,5,3>
+  2690295738U, // <u,5,2,6>: Cost 3 vsldoi8 <0,u,u,5>, <2,6,3,7>
   3775318070U, // <u,5,2,7>: Cost 4 vsldoi8 <2,7,u,5>, <2,7,u,5>
-  2702239879U, // <u,5,2,u>: Cost 2 vsldoi8 <2,u,u,5>, <2,u,u,5>
-  3361369058U, // <u,5,3,0>: Cost 3 vmrglw LHS, <4,1,5,0>
-  2330758034U, // <u,5,3,1>: Cost 2 vmrglw LHS, <4,0,5,1>
-  3720578766U, // <u,5,3,2>: Cost 3 vsldoi4 <4,u,5,3>, <2,3,4,5>
-  3361366955U, // <u,5,3,3>: Cost 3 vmrglw LHS, <1,2,5,3>
-  3361369062U, // <u,5,3,4>: Cost 3 vmrglw LHS, <4,1,5,4>
-  2330758362U, // <u,5,3,5>: Cost 2 vmrglw LHS, <4,4,5,5>
-  2282981890U, // <u,5,3,6>: Cost 2 vmrglw LHS, <3,4,5,6>
-  3361367283U, // <u,5,3,7>: Cost 3 vmrglw LHS, <1,6,5,7>
-  2282981892U, // <u,5,3,u>: Cost 2 vmrglw LHS, <3,4,5,u>
-  3714613350U, // <u,5,4,0>: Cost 3 vsldoi4 <3,u,5,4>, LHS
-  3389909906U, // <u,5,4,1>: Cost 3 vmrglw <5,6,u,4>, <4,0,5,1>
-  3714615026U, // <u,5,4,2>: Cost 3 vsldoi4 <3,u,5,4>, <2,3,u,5>
-  3714616132U, // <u,5,4,3>: Cost 3 vsldoi4 <3,u,5,4>, <3,u,5,4>
-  2711530741U, // <u,5,4,4>: Cost 2 vsldoi8 <4,4,u,5>, <4,4,u,5>
-  2690297142U, // <u,5,4,5>: Cost 2 vsldoi8 <0,u,u,5>, RHS
-  3361380415U, // <u,5,4,6>: Cost 3 vmrglw <0,u,u,4>, <u,4,5,6>
-  3738506920U, // <u,5,4,7>: Cost 3 vsldoi4 <7,u,5,4>, <7,u,5,4>
-  2690297385U, // <u,5,4,u>: Cost 2 vsldoi8 <0,u,u,5>, RHS
-  2646851686U, // <u,5,5,0>: Cost 2 vsldoi4 <4,u,5,5>, LHS
-  3720594228U, // <u,5,5,1>: Cost 3 vsldoi4 <4,u,5,5>, <1,1,1,1>
-  3720595048U, // <u,5,5,2>: Cost 3 vsldoi4 <4,u,5,5>, <2,2,2,2>
-  3361388442U, // <u,5,5,3>: Cost 3 vmrglw <0,u,u,5>, <u,2,5,3>
-  2646855198U, // <u,5,5,4>: Cost 2 vsldoi4 <4,u,5,5>, <4,u,5,5>
-  1369886006U, // <u,5,5,5>: Cost 1 vspltisw1 RHS
-  2266189922U, // <u,5,5,6>: Cost 2 vmrghw RHS, <5,6,7,0>
-  3361388770U, // <u,5,5,7>: Cost 3 vmrglw <0,u,u,5>, <u,6,5,7>
-  1369886006U, // <u,5,5,u>: Cost 1 vspltisw1 RHS
-  2640887910U, // <u,5,6,0>: Cost 2 vsldoi4 <3,u,5,6>, LHS
-  3702687124U, // <u,5,6,1>: Cost 3 vsldoi4 <1,u,5,6>, <1,u,5,6>
-  3708659821U, // <u,5,6,2>: Cost 3 vsldoi4 <2,u,5,6>, <2,u,5,6>
-  2640890694U, // <u,5,6,3>: Cost 2 vsldoi4 <3,u,5,6>, <3,u,5,6>
-  2640891190U, // <u,5,6,4>: Cost 2 vsldoi4 <3,u,5,6>, RHS
-  3854913623U, // <u,5,6,5>: Cost 3 vsldoi12 RHS, <5,6,5,7>
-  2302691842U, // <u,5,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
+  1628498055U, // <u,5,2,u>: Cost 2 vsldoi8 <2,u,u,5>, <2,u,u,5>
+  2287627234U, // <u,5,3,0>: Cost 3 vmrglw LHS, <4,1,5,0>
+  1257016210U, // <u,5,3,1>: Cost 2 vmrglw LHS, <4,0,5,1>
+  2646836942U, // <u,5,3,2>: Cost 3 vsldoi4 <4,u,5,3>, <2,3,4,5>
+  2287625131U, // <u,5,3,3>: Cost 3 vmrglw LHS, <1,2,5,3>
+  2287627238U, // <u,5,3,4>: Cost 3 vmrglw LHS, <4,1,5,4>
+  1257016538U, // <u,5,3,5>: Cost 2 vmrglw LHS, <4,4,5,5>
+  1209240066U, // <u,5,3,6>: Cost 2 vmrglw LHS, <3,4,5,6>
+  2287625459U, // <u,5,3,7>: Cost 3 vmrglw LHS, <1,6,5,7>
+  1209240068U, // <u,5,3,u>: Cost 2 vmrglw LHS, <3,4,5,u>
+  2640871526U, // <u,5,4,0>: Cost 3 vsldoi4 <3,u,5,4>, LHS
+  2316168082U, // <u,5,4,1>: Cost 3 vmrglw <5,6,u,4>, <4,0,5,1>
+  2640873202U, // <u,5,4,2>: Cost 3 vsldoi4 <3,u,5,4>, <2,3,u,5>
+  2640874308U, // <u,5,4,3>: Cost 3 vsldoi4 <3,u,5,4>, <3,u,5,4>
+  1637788917U, // <u,5,4,4>: Cost 2 vsldoi8 <4,4,u,5>, <4,4,u,5>
+  1616555318U, // <u,5,4,5>: Cost 2 vsldoi8 <0,u,u,5>, RHS
+  2287638591U, // <u,5,4,6>: Cost 3 vmrglw <0,u,u,4>, <u,4,5,6>
+  2664765096U, // <u,5,4,7>: Cost 3 vsldoi4 <7,u,5,4>, <7,u,5,4>
+  1616555561U, // <u,5,4,u>: Cost 2 vsldoi8 <0,u,u,5>, RHS
+  1573109862U, // <u,5,5,0>: Cost 2 vsldoi4 <4,u,5,5>, LHS
+  2646852404U, // <u,5,5,1>: Cost 3 vsldoi4 <4,u,5,5>, <1,1,1,1>
+  2646853224U, // <u,5,5,2>: Cost 3 vsldoi4 <4,u,5,5>, <2,2,2,2>
+  2287646618U, // <u,5,5,3>: Cost 3 vmrglw <0,u,u,5>, <u,2,5,3>
+  1573113374U, // <u,5,5,4>: Cost 2 vsldoi4 <4,u,5,5>, <4,u,5,5>
+  296144182U,  // <u,5,5,5>: Cost 1 vspltisw1 RHS
+  1192448098U, // <u,5,5,6>: Cost 2 vmrghw RHS, <5,6,7,0>
+  2287646946U, // <u,5,5,7>: Cost 3 vmrglw <0,u,u,5>, <u,6,5,7>
+  296144182U,  // <u,5,5,u>: Cost 1 vspltisw1 RHS
+  1567146086U, // <u,5,6,0>: Cost 2 vsldoi4 <3,u,5,6>, LHS
+  2628945300U, // <u,5,6,1>: Cost 3 vsldoi4 <1,u,5,6>, <1,u,5,6>
+  2634917997U, // <u,5,6,2>: Cost 3 vsldoi4 <2,u,5,6>, <2,u,5,6>
+  1567148870U, // <u,5,6,3>: Cost 2 vsldoi4 <3,u,5,6>, <3,u,5,6>
+  1567149366U, // <u,5,6,4>: Cost 2 vsldoi4 <3,u,5,6>, RHS
+  2781171799U, // <u,5,6,5>: Cost 3 vsldoi12 RHS, <5,6,5,7>
+  1228950018U, // <u,5,6,6>: Cost 2 vmrglw <3,4,5,6>, <3,4,5,6>
   27705344U,   // <u,5,6,7>: Cost 0 copy RHS
   27705344U,   // <u,5,6,u>: Cost 0 copy RHS
-  3702693990U, // <u,5,7,0>: Cost 3 vsldoi4 <1,u,5,7>, LHS
-  2309557138U, // <u,5,7,1>: Cost 2 vmrglw RHS, <4,0,5,1>
-  3383298558U, // <u,5,7,2>: Cost 3 vmrglw RHS, <3,4,5,2>
-  3383296939U, // <u,5,7,3>: Cost 3 vmrglw RHS, <1,2,5,3>
-  3702697270U, // <u,5,7,4>: Cost 3 vsldoi4 <1,u,5,7>, RHS
-  2309557466U, // <u,5,7,5>: Cost 2 vmrglw RHS, <4,4,5,5>
-  2309556738U, // <u,5,7,6>: Cost 2 vmrglw RHS, <3,4,5,6>
-  3383297267U, // <u,5,7,7>: Cost 3 vmrglw RHS, <1,6,5,7>
-  2309556740U, // <u,5,7,u>: Cost 2 vmrglw RHS, <3,4,5,u>
-  2640904294U, // <u,5,u,0>: Cost 2 vsldoi4 <3,u,5,u>, LHS
-  2690299694U, // <u,5,u,1>: Cost 2 vsldoi8 <0,u,u,5>, LHS
-  3764041605U, // <u,5,u,2>: Cost 3 vsldoi8 <0,u,u,5>, <u,2,3,0>
-  2640907080U, // <u,5,u,3>: Cost 2 vsldoi4 <3,u,5,u>, <3,u,5,u>
-  2640907574U, // <u,5,u,4>: Cost 2 vsldoi4 <3,u,5,u>, RHS
-  1369886006U, // <u,5,u,5>: Cost 1 vspltisw1 RHS
-  2283022850U, // <u,5,u,6>: Cost 2 vmrglw LHS, <3,4,5,6>
+  2628952166U, // <u,5,7,0>: Cost 3 vsldoi4 <1,u,5,7>, LHS
+  1235815314U, // <u,5,7,1>: Cost 2 vmrglw RHS, <4,0,5,1>
+  2309556734U, // <u,5,7,2>: Cost 3 vmrglw RHS, <3,4,5,2>
+  2309555115U, // <u,5,7,3>: Cost 3 vmrglw RHS, <1,2,5,3>
+  2628955446U, // <u,5,7,4>: Cost 3 vsldoi4 <1,u,5,7>, RHS
+  1235815642U, // <u,5,7,5>: Cost 2 vmrglw RHS, <4,4,5,5>
+  1235814914U, // <u,5,7,6>: Cost 2 vmrglw RHS, <3,4,5,6>
+  2309555443U, // <u,5,7,7>: Cost 3 vmrglw RHS, <1,6,5,7>
+  1235814916U, // <u,5,7,u>: Cost 2 vmrglw RHS, <3,4,5,u>
+  1567162470U, // <u,5,u,0>: Cost 2 vsldoi4 <3,u,5,u>, LHS
+  1616557870U, // <u,5,u,1>: Cost 2 vsldoi8 <0,u,u,5>, LHS
+  2690299781U, // <u,5,u,2>: Cost 3 vsldoi8 <0,u,u,5>, <u,2,3,0>
+  1567165256U, // <u,5,u,3>: Cost 2 vsldoi4 <3,u,5,u>, <3,u,5,u>
+  1567165750U, // <u,5,u,4>: Cost 2 vsldoi4 <3,u,5,u>, RHS
+  296144182U,  // <u,5,u,5>: Cost 1 vspltisw1 RHS
+  1209281026U, // <u,5,u,6>: Cost 2 vmrglw LHS, <3,4,5,6>
   27705344U,   // <u,5,u,7>: Cost 0 copy RHS
   27705344U,   // <u,5,u,u>: Cost 0 copy RHS
-  3779305472U, // <u,6,0,0>: Cost 3 vsldoi8 <3,4,u,6>, <0,0,0,0>
-  2705563750U, // <u,6,0,1>: Cost 2 vsldoi8 <3,4,u,6>, LHS
-  3336204794U, // <u,6,0,2>: Cost 3 vmrghw <u,0,1,2>, <6,2,7,3>
-  3720628765U, // <u,6,0,3>: Cost 3 vsldoi4 <4,u,6,0>, <3,4,u,6>
-  3779305810U, // <u,6,0,4>: Cost 3 vsldoi8 <3,4,u,6>, <0,4,1,5>
-  3389804476U, // <u,6,0,5>: Cost 3 vmrglw <5,6,7,0>, <5,4,6,5>
-  3389879096U, // <u,6,0,6>: Cost 3 vmrglw <5,6,u,0>, <6,6,6,6>
-  2289593654U, // <u,6,0,7>: Cost 2 vmrglw <1,2,u,0>, RHS
-  2289593655U, // <u,6,0,u>: Cost 2 vmrglw <1,2,u,0>, RHS
-  3708690534U, // <u,6,1,0>: Cost 3 vsldoi4 <2,u,6,1>, LHS
-  3779306292U, // <u,6,1,1>: Cost 3 vsldoi8 <3,4,u,6>, <1,1,1,1>
-  2263208442U, // <u,6,1,2>: Cost 2 vmrghw LHS, <6,2,7,3>
-  3336950322U, // <u,6,1,3>: Cost 3 vmrghw LHS, <6,3,4,5>
-  3767362667U, // <u,6,1,4>: Cost 3 vsldoi8 <1,4,u,6>, <1,4,u,6>
-  3726610684U, // <u,6,1,5>: Cost 3 vsldoi4 <5,u,6,1>, <5,u,6,1>
-  2263208760U, // <u,6,1,6>: Cost 2 vmrghw LHS, <6,6,6,6>
-  2287611190U, // <u,6,1,7>: Cost 2 vmrglw <0,u,u,1>, RHS
-  2287611191U, // <u,6,1,u>: Cost 2 vmrglw <0,u,u,1>, RHS
-  3732586598U, // <u,6,2,0>: Cost 3 vsldoi4 <6,u,6,2>, LHS
+  2705563648U, // <u,6,0,0>: Cost 3 vsldoi8 <3,4,u,6>, <0,0,0,0>
+  1631821926U, // <u,6,0,1>: Cost 2 vsldoi8 <3,4,u,6>, LHS
+  2262462970U, // <u,6,0,2>: Cost 3 vmrghw <u,0,1,2>, <6,2,7,3>
+  2646886941U, // <u,6,0,3>: Cost 3 vsldoi4 <4,u,6,0>, <3,4,u,6>
+  2705563986U, // <u,6,0,4>: Cost 3 vsldoi8 <3,4,u,6>, <0,4,1,5>
+  2316062652U, // <u,6,0,5>: Cost 3 vmrglw <5,6,7,0>, <5,4,6,5>
+  2316137272U, // <u,6,0,6>: Cost 3 vmrglw <5,6,u,0>, <6,6,6,6>
+  1215851830U, // <u,6,0,7>: Cost 2 vmrglw <1,2,u,0>, RHS
+  1215851831U, // <u,6,0,u>: Cost 2 vmrglw <1,2,u,0>, RHS
+  2634948710U, // <u,6,1,0>: Cost 3 vsldoi4 <2,u,6,1>, LHS
+  2705564468U, // <u,6,1,1>: Cost 3 vsldoi8 <3,4,u,6>, <1,1,1,1>
+  1189466618U, // <u,6,1,2>: Cost 2 vmrghw LHS, <6,2,7,3>
+  2263208498U, // <u,6,1,3>: Cost 3 vmrghw LHS, <6,3,4,5>
+  2693620843U, // <u,6,1,4>: Cost 3 vsldoi8 <1,4,u,6>, <1,4,u,6>
+  2652868860U, // <u,6,1,5>: Cost 3 vsldoi4 <5,u,6,1>, <5,u,6,1>
+  1189466936U, // <u,6,1,6>: Cost 2 vmrghw LHS, <6,6,6,6>
+  1213869366U, // <u,6,1,7>: Cost 2 vmrglw <0,u,u,1>, RHS
+  1213869367U, // <u,6,1,u>: Cost 2 vmrglw <0,u,u,1>, RHS
+  2658844774U, // <u,6,2,0>: Cost 3 vsldoi4 <6,u,6,2>, LHS
   3771344465U, // <u,6,2,1>: Cost 4 vsldoi8 <2,1,u,6>, <2,1,u,6>
-  2252296698U, // <u,6,2,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
-  3772671731U, // <u,6,2,3>: Cost 3 vsldoi8 <2,3,u,6>, <2,3,u,6>
-  3773335364U, // <u,6,2,4>: Cost 3 vsldoi8 <2,4,u,6>, <2,4,u,6>
-  3773998997U, // <u,6,2,5>: Cost 3 vsldoi8 <2,5,u,6>, <2,5,u,6>
-  3779307450U, // <u,6,2,6>: Cost 3 vsldoi8 <3,4,u,6>, <2,6,3,7>
-  2300226870U, // <u,6,2,7>: Cost 2 vmrglw <3,0,u,2>, RHS
-  2300226871U, // <u,6,2,u>: Cost 2 vmrglw <3,0,u,2>, RHS
-  3779307670U, // <u,6,3,0>: Cost 3 vsldoi8 <3,4,u,6>, <3,0,1,2>
-  3404498409U, // <u,6,3,1>: Cost 3 vmrglw LHS, <2,0,6,1>
-  3404498653U, // <u,6,3,2>: Cost 3 vmrglw LHS, <2,3,6,2>
-  3356723558U, // <u,6,3,3>: Cost 3 vmrglw LHS, <3,2,6,3>
-  2705566237U, // <u,6,3,4>: Cost 2 vsldoi8 <3,4,u,6>, <3,4,u,6>
-  3726627070U, // <u,6,3,5>: Cost 3 vsldoi4 <5,u,6,3>, <5,u,6,3>
-  2330759992U, // <u,6,3,6>: Cost 2 vmrglw LHS, <6,6,6,6>
-  1209240886U, // <u,6,3,7>: Cost 1 vmrglw LHS, RHS
-  1209240887U, // <u,6,3,u>: Cost 1 vmrglw LHS, RHS
-  3720659046U, // <u,6,4,0>: Cost 3 vsldoi4 <4,u,6,4>, LHS
-  3291107755U, // <u,6,4,1>: Cost 3 vmrghw <0,4,1,5>, <6,1,7,5>
-  3863908980U, // <u,6,4,2>: Cost 3 vsldoi12 <6,4,2,u>, <6,4,2,u>
-  3720661533U, // <u,6,4,3>: Cost 3 vsldoi4 <4,u,6,4>, <3,4,u,6>
-  3785280758U, // <u,6,4,4>: Cost 3 vsldoi8 <4,4,u,6>, <4,4,u,6>
-  2705567030U, // <u,6,4,5>: Cost 2 vsldoi8 <3,4,u,6>, RHS
-  3389911864U, // <u,6,4,6>: Cost 3 vmrglw <5,6,u,4>, <6,6,6,6>
-  2289626422U, // <u,6,4,7>: Cost 2 vmrglw <1,2,u,4>, RHS
-  2289626423U, // <u,6,4,u>: Cost 2 vmrglw <1,2,u,4>, RHS
-  3708723302U, // <u,6,5,0>: Cost 3 vsldoi4 <2,u,6,5>, LHS
-  3339932071U, // <u,6,5,1>: Cost 3 vmrghw RHS, <6,1,7,1>
-  2266190330U, // <u,6,5,2>: Cost 2 vmrghw RHS, <6,2,7,3>
-  3339932210U, // <u,6,5,3>: Cost 3 vmrghw RHS, <6,3,4,5>
-  3708726582U, // <u,6,5,4>: Cost 3 vsldoi4 <2,u,6,5>, RHS
-  3726643456U, // <u,6,5,5>: Cost 3 vsldoi4 <5,u,6,5>, <5,u,6,5>
-  2266190648U, // <u,6,5,6>: Cost 2 vmrghw RHS, <6,6,6,6>
-  2287643958U, // <u,6,5,7>: Cost 2 vmrglw <0,u,u,5>, RHS
-  2287643959U, // <u,6,5,u>: Cost 2 vmrglw <0,u,u,5>, RHS
-  2657550438U, // <u,6,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
-  3395752269U, // <u,6,6,1>: Cost 3 vmrglw <6,6,6,6>, <6,0,6,1>
-  3792581114U, // <u,6,6,2>: Cost 3 vsldoi8 <5,6,u,6>, <6,2,7,3>
-  3744565789U, // <u,6,6,3>: Cost 3 vsldoi4 <u,u,6,6>, <3,4,u,6>
-  2657553718U, // <u,6,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
-  3797889785U, // <u,6,6,5>: Cost 3 vsldoi8 <6,5,u,6>, <6,5,u,6>
-  1436994870U, // <u,6,6,6>: Cost 1 vspltisw2 RHS
-  2302913846U, // <u,6,6,7>: Cost 2 vmrglw <3,4,u,6>, RHS
-  1436994870U, // <u,6,6,u>: Cost 1 vspltisw2 RHS
-  1573199974U, // <u,6,7,0>: Cost 1 vsldoi4 RHS, LHS
-  2646942516U, // <u,6,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
-  2646943336U, // <u,6,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
-  2646943894U, // <u,6,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
-  1573203497U, // <u,6,7,4>: Cost 1 vsldoi4 RHS, RHS
-  2646945796U, // <u,6,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
-  2309559096U, // <u,6,7,6>: Cost 2 vmrglw RHS, <6,6,6,6>
-  1235815734U, // <u,6,7,7>: Cost 1 vmrglw RHS, RHS
-  1235815735U, // <u,6,7,u>: Cost 1 vmrglw RHS, RHS
-  1573208166U, // <u,6,u,0>: Cost 1 vsldoi4 RHS, LHS
-  2705569582U, // <u,6,u,1>: Cost 2 vsldoi8 <3,4,u,6>, LHS
-  2646951528U, // <u,6,u,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
-  2646952086U, // <u,6,u,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
-  1573211690U, // <u,6,u,4>: Cost 1 vsldoi4 RHS, RHS
-  2705569946U, // <u,6,u,5>: Cost 2 vsldoi8 <3,4,u,6>, RHS
-  1436994870U, // <u,6,u,6>: Cost 1 vspltisw2 RHS
-  1209281846U, // <u,6,u,7>: Cost 1 vmrglw LHS, RHS
-  1209281847U, // <u,6,u,u>: Cost 1 vmrglw LHS, RHS
-  2712207360U, // <u,7,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
-  1638465638U, // <u,7,0,1>: Cost 1 vsldoi8 RHS, LHS
-  3785949357U, // <u,7,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
-  3785949436U, // <u,7,0,3>: Cost 3 vsldoi8 RHS, <0,3,1,0>
-  2712207698U, // <u,7,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
-  2652934404U, // <u,7,0,5>: Cost 2 vsldoi4 <5,u,7,0>, <5,u,7,0>
-  3785949686U, // <u,7,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
-  3389879106U, // <u,7,0,7>: Cost 3 vmrglw <5,6,u,0>, <6,6,7,7>
-  1638466205U, // <u,7,0,u>: Cost 1 vsldoi8 RHS, LHS
-  2263208954U, // <u,7,1,0>: Cost 2 vmrghw LHS, <7,0,1,2>
-  2712208180U, // <u,7,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
-  2712208278U, // <u,7,1,2>: Cost 2 vsldoi8 RHS, <1,2,3,0>
-  3385242106U, // <u,7,1,3>: Cost 3 vmrglw <4,u,u,1>, <6,2,7,3>
-  2263209318U, // <u,7,1,4>: Cost 2 vmrghw LHS, <7,4,5,6>
-  3785950319U, // <u,7,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
-  3768698126U, // <u,7,1,6>: Cost 3 vsldoi8 <1,6,u,7>, <1,6,u,7>
-  2263209580U, // <u,7,1,7>: Cost 2 vmrghw LHS, <7,7,7,7>
-  2712208764U, // <u,7,1,u>: Cost 2 vsldoi8 RHS, <1,u,3,0>
-  3785950653U, // <u,7,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
-  3785950751U, // <u,7,2,1>: Cost 3 vsldoi8 RHS, <2,1,3,1>
-  2712209000U, // <u,7,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
-  2712209062U, // <u,7,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
-  3785950989U, // <u,7,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
-  3785951080U, // <u,7,2,5>: Cost 3 vsldoi8 RHS, <2,5,3,6>
-  2700928999U, // <u,7,2,6>: Cost 2 vsldoi8 <2,6,u,7>, <2,6,u,7>
-  3397858114U, // <u,7,2,7>: Cost 3 vmrglw <7,0,u,2>, <6,6,7,7>
-  2702256265U, // <u,7,2,u>: Cost 2 vsldoi8 <2,u,u,7>, <2,u,u,7>
-  2712209558U, // <u,7,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
-  3785951462U, // <u,7,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
-  3774671211U, // <u,7,3,2>: Cost 3 vsldoi8 <2,6,u,7>, <3,2,6,u>
-  2712209820U, // <u,7,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
-  2712209922U, // <u,7,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
-  3785951826U, // <u,7,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
-  2658931680U, // <u,7,3,6>: Cost 2 vsldoi4 <6,u,7,3>, <6,u,7,3>
-  2330760002U, // <u,7,3,7>: Cost 2 vmrglw LHS, <6,6,7,7>
-  2712210206U, // <u,7,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
-  2712210322U, // <u,7,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
-  3785952202U, // <u,7,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
-  3785952309U, // <u,7,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
-  3785952388U, // <u,7,4,3>: Cost 3 vsldoi8 RHS, <4,3,5,0>
-  2712210640U, // <u,7,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
-  1638468936U, // <u,7,4,5>: Cost 1 vsldoi8 RHS, RHS
-  3785952633U, // <u,7,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,2>
-  3785952712U, // <u,7,4,7>: Cost 3 vsldoi8 RHS, <4,7,5,0>
-  1638469161U, // <u,7,4,u>: Cost 1 vsldoi8 RHS, RHS
-  2266190842U, // <u,7,5,0>: Cost 2 vmrghw RHS, <7,0,1,2>
-  3787943567U, // <u,7,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
-  3785953022U, // <u,7,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
-  3385274874U, // <u,7,5,3>: Cost 3 vmrglw <4,u,u,5>, <6,2,7,3>
-  2266191206U, // <u,7,5,4>: Cost 2 vmrghw RHS, <7,4,5,6>
-  2712211460U, // <u,7,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
-  2712211554U, // <u,7,5,6>: Cost 2 vsldoi8 RHS, <5,6,7,0>
-  2266191468U, // <u,7,5,7>: Cost 2 vmrghw RHS, <7,7,7,7>
-  2712211716U, // <u,7,5,u>: Cost 2 vsldoi8 RHS, <5,u,7,0>
-  3785953569U, // <u,7,6,0>: Cost 3 vsldoi8 RHS, <6,0,1,2>
-  3785953703U, // <u,7,6,1>: Cost 3 vsldoi8 RHS, <6,1,7,1>
-  2712211962U, // <u,7,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
-  3785953842U, // <u,7,6,3>: Cost 3 vsldoi8 RHS, <6,3,4,5>
-  3785953933U, // <u,7,6,4>: Cost 3 vsldoi8 RHS, <6,4,5,6>
-  3785954027U, // <u,7,6,5>: Cost 3 vsldoi8 RHS, <6,5,7,1>
-  2712212280U, // <u,7,6,6>: Cost 2 vsldoi8 RHS, <6,6,6,6>
-  2712212302U, // <u,7,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
-  2712212383U, // <u,7,6,u>: Cost 2 vsldoi8 RHS, <6,u,0,1>
-  2309558370U, // <u,7,7,0>: Cost 2 vmrglw RHS, <5,6,7,0>
-  3383300195U, // <u,7,7,1>: Cost 3 vmrglw RHS, <5,6,7,1>
-  3714787258U, // <u,7,7,2>: Cost 3 vsldoi4 <3,u,7,7>, <2,6,3,7>
-  2309558778U, // <u,7,7,3>: Cost 2 vmrglw RHS, <6,2,7,3>
-  2309558374U, // <u,7,7,4>: Cost 2 vmrglw RHS, <5,6,7,4>
-  3383300199U, // <u,7,7,5>: Cost 3 vmrglw RHS, <5,6,7,5>
-  2658964452U, // <u,7,7,6>: Cost 2 vsldoi4 <6,u,7,7>, <6,u,7,7>
-  1504103734U, // <u,7,7,7>: Cost 1 vspltisw3 RHS
-  1504103734U, // <u,7,7,u>: Cost 1 vspltisw3 RHS
-  2712213203U, // <u,7,u,0>: Cost 2 vsldoi8 RHS, <u,0,1,2>
-  1638471470U, // <u,7,u,1>: Cost 1 vsldoi8 RHS, LHS
-  2712213381U, // <u,7,u,2>: Cost 2 vsldoi8 RHS, <u,2,3,0>
-  2712213436U, // <u,7,u,3>: Cost 2 vsldoi8 RHS, <u,3,0,1>
-  2712213567U, // <u,7,u,4>: Cost 2 vsldoi8 RHS, <u,4,5,6>
-  1638471834U, // <u,7,u,5>: Cost 1 vsldoi8 RHS, RHS
-  2712213712U, // <u,7,u,6>: Cost 2 vsldoi8 RHS, <u,6,3,7>
-  1504103734U, // <u,7,u,7>: Cost 1 vspltisw3 RHS
-  1638472037U, // <u,7,u,u>: Cost 1 vsldoi8 RHS, LHS
-  1275904102U, // <u,u,0,0>: Cost 1 vspltisw0 LHS
-  1611931809U, // <u,u,0,1>: Cost 1 vsldoi8 LHS, LHS
-  3759415469U, // <u,u,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
-  2289590428U, // <u,u,0,3>: Cost 2 vmrglw <1,2,u,0>, LHS
-  2685673810U, // <u,u,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
-  2653008141U, // <u,u,0,5>: Cost 2 vsldoi4 <5,u,u,0>, <5,u,u,0>
-  3363334685U, // <u,u,0,6>: Cost 3 vmrglw <1,2,u,0>, <3,4,u,6>
-  2289593672U, // <u,u,0,7>: Cost 2 vmrglw <1,2,u,0>, RHS
-  1611932317U, // <u,u,0,u>: Cost 1 vsldoi8 LHS, LHS
-  2623152849U, // <u,u,1,0>: Cost 2 vsldoi4 <0,u,u,1>, <0,u,u,1>
-  1189467950U, // <u,u,1,1>: Cost 1 vmrghw LHS, LHS
-  1678604078U, // <u,u,1,2>: Cost 1 vsldoi12 LHS, LHS
-  2287607964U, // <u,u,1,3>: Cost 2 vmrglw <0,u,u,1>, LHS
-  2623155510U, // <u,u,1,4>: Cost 2 vsldoi4 <0,u,u,1>, RHS
-  1189468314U, // <u,u,1,5>: Cost 1 vmrghw LHS, RHS
-  2658989031U, // <u,u,1,6>: Cost 2 vsldoi4 <6,u,u,1>, <6,u,u,1>
-  2287611208U, // <u,u,1,7>: Cost 2 vmrglw <0,u,u,1>, RHS
-  1678604132U, // <u,u,1,u>: Cost 1 vsldoi12 LHS, LHS
-  2641076326U, // <u,u,2,0>: Cost 2 vsldoi4 <3,u,u,2>, LHS
-  2263922478U, // <u,u,2,1>: Cost 2 vmrghw <u,2,3,0>, LHS
-  1410121830U, // <u,u,2,2>: Cost 1 vspltisw2 LHS
+  1178554874U, // <u,6,2,2>: Cost 2 vmrghw <6,2,7,3>, <6,2,7,3>
+  2698929907U, // <u,6,2,3>: Cost 3 vsldoi8 <2,3,u,6>, <2,3,u,6>
+  2699593540U, // <u,6,2,4>: Cost 3 vsldoi8 <2,4,u,6>, <2,4,u,6>
+  2700257173U, // <u,6,2,5>: Cost 3 vsldoi8 <2,5,u,6>, <2,5,u,6>
+  2705565626U, // <u,6,2,6>: Cost 3 vsldoi8 <3,4,u,6>, <2,6,3,7>
+  1226485046U, // <u,6,2,7>: Cost 2 vmrglw <3,0,u,2>, RHS
+  1226485047U, // <u,6,2,u>: Cost 2 vmrglw <3,0,u,2>, RHS
+  2705565846U, // <u,6,3,0>: Cost 3 vsldoi8 <3,4,u,6>, <3,0,1,2>
+  2330756585U, // <u,6,3,1>: Cost 3 vmrglw LHS, <2,0,6,1>
+  2330756829U, // <u,6,3,2>: Cost 3 vmrglw LHS, <2,3,6,2>
+  2282981734U, // <u,6,3,3>: Cost 3 vmrglw LHS, <3,2,6,3>
+  1631824413U, // <u,6,3,4>: Cost 2 vsldoi8 <3,4,u,6>, <3,4,u,6>
+  2652885246U, // <u,6,3,5>: Cost 3 vsldoi4 <5,u,6,3>, <5,u,6,3>
+  1257018168U, // <u,6,3,6>: Cost 2 vmrglw LHS, <6,6,6,6>
+  135499062U,  // <u,6,3,7>: Cost 1 vmrglw LHS, RHS
+  135499063U,  // <u,6,3,u>: Cost 1 vmrglw LHS, RHS
+  2646917222U, // <u,6,4,0>: Cost 3 vsldoi4 <4,u,6,4>, LHS
+  2217365931U, // <u,6,4,1>: Cost 3 vmrghw <0,4,1,5>, <6,1,7,5>
+  2790167156U, // <u,6,4,2>: Cost 3 vsldoi12 <6,4,2,u>, <6,4,2,u>
+  2646919709U, // <u,6,4,3>: Cost 3 vsldoi4 <4,u,6,4>, <3,4,u,6>
+  2711538934U, // <u,6,4,4>: Cost 3 vsldoi8 <4,4,u,6>, <4,4,u,6>
+  1631825206U, // <u,6,4,5>: Cost 2 vsldoi8 <3,4,u,6>, RHS
+  2316170040U, // <u,6,4,6>: Cost 3 vmrglw <5,6,u,4>, <6,6,6,6>
+  1215884598U, // <u,6,4,7>: Cost 2 vmrglw <1,2,u,4>, RHS
+  1215884599U, // <u,6,4,u>: Cost 2 vmrglw <1,2,u,4>, RHS
+  2634981478U, // <u,6,5,0>: Cost 3 vsldoi4 <2,u,6,5>, LHS
+  2266190247U, // <u,6,5,1>: Cost 3 vmrghw RHS, <6,1,7,1>
+  1192448506U, // <u,6,5,2>: Cost 2 vmrghw RHS, <6,2,7,3>
+  2266190386U, // <u,6,5,3>: Cost 3 vmrghw RHS, <6,3,4,5>
+  2634984758U, // <u,6,5,4>: Cost 3 vsldoi4 <2,u,6,5>, RHS
+  2652901632U, // <u,6,5,5>: Cost 3 vsldoi4 <5,u,6,5>, <5,u,6,5>
+  1192448824U, // <u,6,5,6>: Cost 2 vmrghw RHS, <6,6,6,6>
+  1213902134U, // <u,6,5,7>: Cost 2 vmrglw <0,u,u,5>, RHS
+  1213902135U, // <u,6,5,u>: Cost 2 vmrglw <0,u,u,5>, RHS
+  1583808614U, // <u,6,6,0>: Cost 2 vsldoi4 <6,6,6,6>, LHS
+  2322010445U, // <u,6,6,1>: Cost 3 vmrglw <6,6,6,6>, <6,0,6,1>
+  2718839290U, // <u,6,6,2>: Cost 3 vsldoi8 <5,6,u,6>, <6,2,7,3>
+  2670823965U, // <u,6,6,3>: Cost 3 vsldoi4 <u,u,6,6>, <3,4,u,6>
+  1583811894U, // <u,6,6,4>: Cost 2 vsldoi4 <6,6,6,6>, RHS
+  2724147961U, // <u,6,6,5>: Cost 3 vsldoi8 <6,5,u,6>, <6,5,u,6>
+  363253046U,  // <u,6,6,6>: Cost 1 vspltisw2 RHS
+  1229172022U, // <u,6,6,7>: Cost 2 vmrglw <3,4,u,6>, RHS
+  363253046U,  // <u,6,6,u>: Cost 1 vspltisw2 RHS
+  499458150U,  // <u,6,7,0>: Cost 1 vsldoi4 RHS, LHS
+  1573200692U, // <u,6,7,1>: Cost 2 vsldoi4 RHS, <1,1,1,1>
+  1573201512U, // <u,6,7,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
+  1573202070U, // <u,6,7,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
+  499461673U,  // <u,6,7,4>: Cost 1 vsldoi4 RHS, RHS
+  1573203972U, // <u,6,7,5>: Cost 2 vsldoi4 RHS, <5,5,5,5>
+  1235817272U, // <u,6,7,6>: Cost 2 vmrglw RHS, <6,6,6,6>
+  162073910U,  // <u,6,7,7>: Cost 1 vmrglw RHS, RHS
+  162073911U,  // <u,6,7,u>: Cost 1 vmrglw RHS, RHS
+  499466342U,  // <u,6,u,0>: Cost 1 vsldoi4 RHS, LHS
+  1631827758U, // <u,6,u,1>: Cost 2 vsldoi8 <3,4,u,6>, LHS
+  1573209704U, // <u,6,u,2>: Cost 2 vsldoi4 RHS, <2,2,2,2>
+  1573210262U, // <u,6,u,3>: Cost 2 vsldoi4 RHS, <3,0,1,2>
+  499469866U,  // <u,6,u,4>: Cost 1 vsldoi4 RHS, RHS
+  1631828122U, // <u,6,u,5>: Cost 2 vsldoi8 <3,4,u,6>, RHS
+  363253046U,  // <u,6,u,6>: Cost 1 vspltisw2 RHS
+  135540022U,  // <u,6,u,7>: Cost 1 vmrglw LHS, RHS
+  135540023U,  // <u,6,u,u>: Cost 1 vmrglw LHS, RHS
+  1638465536U, // <u,7,0,0>: Cost 2 vsldoi8 RHS, <0,0,0,0>
+  564723814U,  // <u,7,0,1>: Cost 1 vsldoi8 RHS, LHS
+  2712207533U, // <u,7,0,2>: Cost 3 vsldoi8 RHS, <0,2,1,2>
+  2712207612U, // <u,7,0,3>: Cost 3 vsldoi8 RHS, <0,3,1,0>
+  1638465874U, // <u,7,0,4>: Cost 2 vsldoi8 RHS, <0,4,1,5>
+  1579192580U, // <u,7,0,5>: Cost 2 vsldoi4 <5,u,7,0>, <5,u,7,0>
+  2712207862U, // <u,7,0,6>: Cost 3 vsldoi8 RHS, <0,6,1,7>
+  2316137282U, // <u,7,0,7>: Cost 3 vmrglw <5,6,u,0>, <6,6,7,7>
+  564724381U,  // <u,7,0,u>: Cost 1 vsldoi8 RHS, LHS
+  1189467130U, // <u,7,1,0>: Cost 2 vmrghw LHS, <7,0,1,2>
+  1638466356U, // <u,7,1,1>: Cost 2 vsldoi8 RHS, <1,1,1,1>
+  1638466454U, // <u,7,1,2>: Cost 2 vsldoi8 RHS, <1,2,3,0>
+  2311500282U, // <u,7,1,3>: Cost 3 vmrglw <4,u,u,1>, <6,2,7,3>
+  1189467494U, // <u,7,1,4>: Cost 2 vmrghw LHS, <7,4,5,6>
+  2712208495U, // <u,7,1,5>: Cost 3 vsldoi8 RHS, <1,5,0,1>
+  2694956302U, // <u,7,1,6>: Cost 3 vsldoi8 <1,6,u,7>, <1,6,u,7>
+  1189467756U, // <u,7,1,7>: Cost 2 vmrghw LHS, <7,7,7,7>
+  1638466940U, // <u,7,1,u>: Cost 2 vsldoi8 RHS, <1,u,3,0>
+  2712208829U, // <u,7,2,0>: Cost 3 vsldoi8 RHS, <2,0,1,2>
+  2712208927U, // <u,7,2,1>: Cost 3 vsldoi8 RHS, <2,1,3,1>
+  1638467176U, // <u,7,2,2>: Cost 2 vsldoi8 RHS, <2,2,2,2>
+  1638467238U, // <u,7,2,3>: Cost 2 vsldoi8 RHS, <2,3,0,1>
+  2712209165U, // <u,7,2,4>: Cost 3 vsldoi8 RHS, <2,4,2,5>
+  2712209256U, // <u,7,2,5>: Cost 3 vsldoi8 RHS, <2,5,3,6>
+  1627187175U, // <u,7,2,6>: Cost 2 vsldoi8 <2,6,u,7>, <2,6,u,7>
+  2324116290U, // <u,7,2,7>: Cost 3 vmrglw <7,0,u,2>, <6,6,7,7>
+  1628514441U, // <u,7,2,u>: Cost 2 vsldoi8 <2,u,u,7>, <2,u,u,7>
+  1638467734U, // <u,7,3,0>: Cost 2 vsldoi8 RHS, <3,0,1,2>
+  2712209638U, // <u,7,3,1>: Cost 3 vsldoi8 RHS, <3,1,1,1>
+  2700929387U, // <u,7,3,2>: Cost 3 vsldoi8 <2,6,u,7>, <3,2,6,u>
+  1638467996U, // <u,7,3,3>: Cost 2 vsldoi8 RHS, <3,3,3,3>
+  1638468098U, // <u,7,3,4>: Cost 2 vsldoi8 RHS, <3,4,5,6>
+  2712210002U, // <u,7,3,5>: Cost 3 vsldoi8 RHS, <3,5,5,5>
+  1585189856U, // <u,7,3,6>: Cost 2 vsldoi4 <6,u,7,3>, <6,u,7,3>
+  1257018178U, // <u,7,3,7>: Cost 2 vmrglw LHS, <6,6,7,7>
+  1638468382U, // <u,7,3,u>: Cost 2 vsldoi8 RHS, <3,u,1,2>
+  1638468498U, // <u,7,4,0>: Cost 2 vsldoi8 RHS, <4,0,5,1>
+  2712210378U, // <u,7,4,1>: Cost 3 vsldoi8 RHS, <4,1,2,3>
+  2712210485U, // <u,7,4,2>: Cost 3 vsldoi8 RHS, <4,2,5,2>
+  2712210564U, // <u,7,4,3>: Cost 3 vsldoi8 RHS, <4,3,5,0>
+  1638468816U, // <u,7,4,4>: Cost 2 vsldoi8 RHS, <4,4,4,4>
+  564727112U,  // <u,7,4,5>: Cost 1 vsldoi8 RHS, RHS
+  2712210809U, // <u,7,4,6>: Cost 3 vsldoi8 RHS, <4,6,5,2>
+  2712210888U, // <u,7,4,7>: Cost 3 vsldoi8 RHS, <4,7,5,0>
+  564727337U,  // <u,7,4,u>: Cost 1 vsldoi8 RHS, RHS
+  1192449018U, // <u,7,5,0>: Cost 2 vmrghw RHS, <7,0,1,2>
+  2714201743U, // <u,7,5,1>: Cost 3 vsldoi8 RHS, <5,1,0,1>
+  2712211198U, // <u,7,5,2>: Cost 3 vsldoi8 RHS, <5,2,3,4>
+  2311533050U, // <u,7,5,3>: Cost 3 vmrglw <4,u,u,5>, <6,2,7,3>
+  1192449382U, // <u,7,5,4>: Cost 2 vmrghw RHS, <7,4,5,6>
+  1638469636U, // <u,7,5,5>: Cost 2 vsldoi8 RHS, <5,5,5,5>
+  1638469730U, // <u,7,5,6>: Cost 2 vsldoi8 RHS, <5,6,7,0>
+  1192449644U, // <u,7,5,7>: Cost 2 vmrghw RHS, <7,7,7,7>
+  1638469892U, // <u,7,5,u>: Cost 2 vsldoi8 RHS, <5,u,7,0>
+  2712211745U, // <u,7,6,0>: Cost 3 vsldoi8 RHS, <6,0,1,2>
+  2712211879U, // <u,7,6,1>: Cost 3 vsldoi8 RHS, <6,1,7,1>
+  1638470138U, // <u,7,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
+  2712212018U, // <u,7,6,3>: Cost 3 vsldoi8 RHS, <6,3,4,5>
+  2712212109U, // <u,7,6,4>: Cost 3 vsldoi8 RHS, <6,4,5,6>
+  2712212203U, // <u,7,6,5>: Cost 3 vsldoi8 RHS, <6,5,7,1>
+  1638470456U, // <u,7,6,6>: Cost 2 vsldoi8 RHS, <6,6,6,6>
+  1638470478U, // <u,7,6,7>: Cost 2 vsldoi8 RHS, <6,7,0,1>
+  1638470559U, // <u,7,6,u>: Cost 2 vsldoi8 RHS, <6,u,0,1>
+  1235816546U, // <u,7,7,0>: Cost 2 vmrglw RHS, <5,6,7,0>
+  2309558371U, // <u,7,7,1>: Cost 3 vmrglw RHS, <5,6,7,1>
+  2641045434U, // <u,7,7,2>: Cost 3 vsldoi4 <3,u,7,7>, <2,6,3,7>
+  1235816954U, // <u,7,7,3>: Cost 2 vmrglw RHS, <6,2,7,3>
+  1235816550U, // <u,7,7,4>: Cost 2 vmrglw RHS, <5,6,7,4>
+  2309558375U, // <u,7,7,5>: Cost 3 vmrglw RHS, <5,6,7,5>
+  1585222628U, // <u,7,7,6>: Cost 2 vsldoi4 <6,u,7,7>, <6,u,7,7>
+  430361910U,  // <u,7,7,7>: Cost 1 vspltisw3 RHS
+  430361910U,  // <u,7,7,u>: Cost 1 vspltisw3 RHS
+  1638471379U, // <u,7,u,0>: Cost 2 vsldoi8 RHS, <u,0,1,2>
+  564729646U,  // <u,7,u,1>: Cost 1 vsldoi8 RHS, LHS
+  1638471557U, // <u,7,u,2>: Cost 2 vsldoi8 RHS, <u,2,3,0>
+  1638471612U, // <u,7,u,3>: Cost 2 vsldoi8 RHS, <u,3,0,1>
+  1638471743U, // <u,7,u,4>: Cost 2 vsldoi8 RHS, <u,4,5,6>
+  564730010U,  // <u,7,u,5>: Cost 1 vsldoi8 RHS, RHS
+  1638471888U, // <u,7,u,6>: Cost 2 vsldoi8 RHS, <u,6,3,7>
+  430361910U,  // <u,7,u,7>: Cost 1 vspltisw3 RHS
+  564730213U,  // <u,7,u,u>: Cost 1 vsldoi8 RHS, LHS
+  202162278U,  // <u,u,0,0>: Cost 1 vspltisw0 LHS
+  538189985U,  // <u,u,0,1>: Cost 1 vsldoi8 LHS, LHS
+  2685673645U, // <u,u,0,2>: Cost 3 vsldoi8 LHS, <0,2,1,2>
+  1215848604U, // <u,u,0,3>: Cost 2 vmrglw <1,2,u,0>, LHS
+  1611931986U, // <u,u,0,4>: Cost 2 vsldoi8 LHS, <0,4,1,5>
+  1579266317U, // <u,u,0,5>: Cost 2 vsldoi4 <5,u,u,0>, <5,u,u,0>
+  2289592861U, // <u,u,0,6>: Cost 3 vmrglw <1,2,u,0>, <3,4,u,6>
+  1215851848U, // <u,u,0,7>: Cost 2 vmrglw <1,2,u,0>, RHS
+  538190493U,  // <u,u,0,u>: Cost 1 vsldoi8 LHS, LHS
+  1549411025U, // <u,u,1,0>: Cost 2 vsldoi4 <0,u,u,1>, <0,u,u,1>
+  115726126U,  // <u,u,1,1>: Cost 1 vmrghw LHS, LHS
+  604862254U,  // <u,u,1,2>: Cost 1 vsldoi12 LHS, LHS
+  1213866140U, // <u,u,1,3>: Cost 2 vmrglw <0,u,u,1>, LHS
+  1549413686U, // <u,u,1,4>: Cost 2 vsldoi4 <0,u,u,1>, RHS
+  115726490U,  // <u,u,1,5>: Cost 1 vmrghw LHS, RHS
+  1585247207U, // <u,u,1,6>: Cost 2 vsldoi4 <6,u,u,1>, <6,u,u,1>
+  1213869384U, // <u,u,1,7>: Cost 2 vmrglw <0,u,u,1>, RHS
+  604862308U,  // <u,u,1,u>: Cost 1 vsldoi12 LHS, LHS
+  1567334502U, // <u,u,2,0>: Cost 2 vsldoi4 <3,u,u,2>, LHS
+  1190180654U, // <u,u,2,1>: Cost 2 vmrghw <u,2,3,0>, LHS
+  336380006U,  // <u,u,2,2>: Cost 1 vspltisw2 LHS
   835584U,     // <u,u,2,3>: Cost 0 copy LHS
-  2641079606U, // <u,u,2,4>: Cost 2 vsldoi4 <3,u,u,2>, RHS
-  2263922842U, // <u,u,2,5>: Cost 2 vmrghw <u,2,3,0>, RHS
-  2685675450U, // <u,u,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
-  2300226888U, // <u,u,2,7>: Cost 2 vmrglw <3,0,u,2>, RHS
+  1567337782U, // <u,u,2,4>: Cost 2 vsldoi4 <3,u,u,2>, RHS
+  1190181018U, // <u,u,2,5>: Cost 2 vmrghw <u,2,3,0>, RHS
+  1611933626U, // <u,u,2,6>: Cost 2 vsldoi8 LHS, <2,6,3,7>
+  1226485064U, // <u,u,2,7>: Cost 2 vmrglw <3,0,u,2>, RHS
   835584U,     // <u,u,2,u>: Cost 0 copy LHS
-  1549427411U, // <u,u,3,0>: Cost 1 vsldoi4 LHS, LHS
-  2282981102U, // <u,u,3,1>: Cost 2 vmrglw LHS, <2,3,u,1>
-  2282981589U, // <u,u,3,2>: Cost 2 vmrglw LHS, <3,0,u,2>
-  1209237660U, // <u,u,3,3>: Cost 1 vmrglw LHS, LHS
-  1549430070U, // <u,u,3,4>: Cost 1 vsldoi4 LHS, RHS
-  2282981106U, // <u,u,3,5>: Cost 2 vmrglw LHS, <2,3,u,5>
-  2282981917U, // <u,u,3,6>: Cost 2 vmrglw LHS, <3,4,u,6>
-  1209240904U, // <u,u,3,7>: Cost 1 vmrglw LHS, RHS
-  1209237665U, // <u,u,3,u>: Cost 1 vmrglw LHS, LHS
-  2629148774U, // <u,u,4,0>: Cost 2 vsldoi4 <1,u,u,4>, LHS
-  2629150125U, // <u,u,4,1>: Cost 2 vsldoi4 <1,u,u,4>, <1,u,u,4>
-  3363367125U, // <u,u,4,2>: Cost 3 vmrglw <1,2,u,4>, <3,0,u,2>
-  2289623196U, // <u,u,4,3>: Cost 2 vmrglw <1,2,u,4>, LHS
-  1302777142U, // <u,u,4,4>: Cost 1 vspltisw0 RHS
-  1611935030U, // <u,u,4,5>: Cost 1 vsldoi8 LHS, RHS
-  3363367453U, // <u,u,4,6>: Cost 3 vmrglw <1,2,u,4>, <3,4,u,6>
-  2289626440U, // <u,u,4,7>: Cost 2 vmrglw <1,2,u,4>, RHS
-  1611935273U, // <u,u,4,u>: Cost 1 vsldoi8 LHS, RHS
-  2623185621U, // <u,u,5,0>: Cost 2 vsldoi4 <0,u,u,5>, <0,u,u,5>
-  1192449838U, // <u,u,5,1>: Cost 1 vmrghw RHS, LHS
-  2635131015U, // <u,u,5,2>: Cost 2 vsldoi4 <2,u,u,5>, <2,u,u,5>
-  2287640732U, // <u,u,5,3>: Cost 2 vmrglw <0,u,u,5>, LHS
-  2623188278U, // <u,u,5,4>: Cost 2 vsldoi4 <0,u,u,5>, RHS
-  1192450202U, // <u,u,5,5>: Cost 1 vmrghw RHS, RHS
-  1678604442U, // <u,u,5,6>: Cost 1 vsldoi12 LHS, RHS
-  2287643976U, // <u,u,5,7>: Cost 2 vmrglw <0,u,u,5>, RHS
-  1678604460U, // <u,u,5,u>: Cost 1 vsldoi12 LHS, RHS
-  2641109094U, // <u,u,6,0>: Cost 2 vsldoi4 <3,u,u,6>, LHS
-  2266634030U, // <u,u,6,1>: Cost 2 vmrghw <u,6,3,7>, LHS
-  2712220154U, // <u,u,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
-  2752788688U, // <u,u,6,3>: Cost 2 vsldoi12 LHS, <u,6,3,7>
-  2641112374U, // <u,u,6,4>: Cost 2 vsldoi4 <3,u,u,6>, RHS
-  2266634394U, // <u,u,6,5>: Cost 2 vmrghw <u,6,3,7>, RHS
-  1436994870U, // <u,u,6,6>: Cost 1 vspltisw2 RHS
+  475685587U,  // <u,u,3,0>: Cost 1 vsldoi4 LHS, LHS
+  1209239278U, // <u,u,3,1>: Cost 2 vmrglw LHS, <2,3,u,1>
+  1209239765U, // <u,u,3,2>: Cost 2 vmrglw LHS, <3,0,u,2>
+  135495836U,  // <u,u,3,3>: Cost 1 vmrglw LHS, LHS
+  475688246U,  // <u,u,3,4>: Cost 1 vsldoi4 LHS, RHS
+  1209239282U, // <u,u,3,5>: Cost 2 vmrglw LHS, <2,3,u,5>
+  1209240093U, // <u,u,3,6>: Cost 2 vmrglw LHS, <3,4,u,6>
+  135499080U,  // <u,u,3,7>: Cost 1 vmrglw LHS, RHS
+  135495841U,  // <u,u,3,u>: Cost 1 vmrglw LHS, LHS
+  1555406950U, // <u,u,4,0>: Cost 2 vsldoi4 <1,u,u,4>, LHS
+  1555408301U, // <u,u,4,1>: Cost 2 vsldoi4 <1,u,u,4>, <1,u,u,4>
+  2289625301U, // <u,u,4,2>: Cost 3 vmrglw <1,2,u,4>, <3,0,u,2>
+  1215881372U, // <u,u,4,3>: Cost 2 vmrglw <1,2,u,4>, LHS
+  229035318U,  // <u,u,4,4>: Cost 1 vspltisw0 RHS
+  538193206U,  // <u,u,4,5>: Cost 1 vsldoi8 LHS, RHS
+  2289625629U, // <u,u,4,6>: Cost 3 vmrglw <1,2,u,4>, <3,4,u,6>
+  1215884616U, // <u,u,4,7>: Cost 2 vmrglw <1,2,u,4>, RHS
+  538193449U,  // <u,u,4,u>: Cost 1 vsldoi8 LHS, RHS
+  1549443797U, // <u,u,5,0>: Cost 2 vsldoi4 <0,u,u,5>, <0,u,u,5>
+  118708014U,  // <u,u,5,1>: Cost 1 vmrghw RHS, LHS
+  1561389191U, // <u,u,5,2>: Cost 2 vsldoi4 <2,u,u,5>, <2,u,u,5>
+  1213898908U, // <u,u,5,3>: Cost 2 vmrglw <0,u,u,5>, LHS
+  1549446454U, // <u,u,5,4>: Cost 2 vsldoi4 <0,u,u,5>, RHS
+  118708378U,  // <u,u,5,5>: Cost 1 vmrghw RHS, RHS
+  604862618U,  // <u,u,5,6>: Cost 1 vsldoi12 LHS, RHS
+  1213902152U, // <u,u,5,7>: Cost 2 vmrglw <0,u,u,5>, RHS
+  604862636U,  // <u,u,5,u>: Cost 1 vsldoi12 LHS, RHS
+  1567367270U, // <u,u,6,0>: Cost 2 vsldoi4 <3,u,u,6>, LHS
+  1192892206U, // <u,u,6,1>: Cost 2 vmrghw <u,6,3,7>, LHS
+  1638478330U, // <u,u,6,2>: Cost 2 vsldoi8 RHS, <6,2,7,3>
+  1679046864U, // <u,u,6,3>: Cost 2 vsldoi12 LHS, <u,6,3,7>
+  1567370550U, // <u,u,6,4>: Cost 2 vsldoi4 <3,u,u,6>, RHS
+  1192892570U, // <u,u,6,5>: Cost 2 vmrghw <u,6,3,7>, RHS
+  363253046U,  // <u,u,6,6>: Cost 1 vspltisw2 RHS
   27705344U,   // <u,u,6,7>: Cost 0 copy RHS
   27705344U,   // <u,u,6,u>: Cost 0 copy RHS
-  1573347430U, // <u,u,7,0>: Cost 1 vsldoi4 RHS, LHS
-  2309554249U, // <u,u,7,1>: Cost 2 vmrglw RHS, <0,0,u,1>
-  2635147401U, // <u,u,7,2>: Cost 2 vsldoi4 <2,u,u,7>, <2,u,u,7>
-  1235812508U, // <u,u,7,3>: Cost 1 vmrglw RHS, LHS
-  1573350971U, // <u,u,7,4>: Cost 1 vsldoi4 RHS, RHS
-  2309554577U, // <u,u,7,5>: Cost 2 vmrglw RHS, <0,4,u,5>
-  2309556765U, // <u,u,7,6>: Cost 2 vmrglw RHS, <3,4,u,6>
-  1235815752U, // <u,u,7,7>: Cost 1 vmrglw RHS, RHS
-  1235812513U, // <u,u,7,u>: Cost 1 vmrglw RHS, LHS
-  1549468376U, // <u,u,u,0>: Cost 1 vsldoi4 LHS, LHS
-  1611937582U, // <u,u,u,1>: Cost 1 vsldoi8 LHS, LHS
-  1678604645U, // <u,u,u,2>: Cost 1 vsldoi12 LHS, LHS
+  499605606U,  // <u,u,7,0>: Cost 1 vsldoi4 RHS, LHS
+  1235812425U, // <u,u,7,1>: Cost 2 vmrglw RHS, <0,0,u,1>
+  1561405577U, // <u,u,7,2>: Cost 2 vsldoi4 <2,u,u,7>, <2,u,u,7>
+  162070684U,  // <u,u,7,3>: Cost 1 vmrglw RHS, LHS
+  499609147U,  // <u,u,7,4>: Cost 1 vsldoi4 RHS, RHS
+  1235812753U, // <u,u,7,5>: Cost 2 vmrglw RHS, <0,4,u,5>
+  1235814941U, // <u,u,7,6>: Cost 2 vmrglw RHS, <3,4,u,6>
+  162073928U,  // <u,u,7,7>: Cost 1 vmrglw RHS, RHS
+  162070689U,  // <u,u,7,u>: Cost 1 vmrglw RHS, LHS
+  475726552U,  // <u,u,u,0>: Cost 1 vsldoi4 LHS, LHS
+  538195758U,  // <u,u,u,1>: Cost 1 vsldoi8 LHS, LHS
+  604862821U,  // <u,u,u,2>: Cost 1 vsldoi12 LHS, LHS
   835584U,     // <u,u,u,3>: Cost 0 copy LHS
-  1549471030U, // <u,u,u,4>: Cost 1 vsldoi4 LHS, RHS
-  1611937946U, // <u,u,u,5>: Cost 1 vsldoi8 LHS, RHS
-  1678604685U, // <u,u,u,6>: Cost 1 vsldoi12 LHS, RHS
+  475729206U,  // <u,u,u,4>: Cost 1 vsldoi4 LHS, RHS
+  538196122U,  // <u,u,u,5>: Cost 1 vsldoi8 LHS, RHS
+  604862861U,  // <u,u,u,6>: Cost 1 vsldoi12 LHS, RHS
   27705344U,   // <u,u,u,7>: Cost 0 copy RHS
   835584U,     // <u,u,u,u>: Cost 0 copy LHS
   0