mirror of
https://github.com/NGSolve/netgen.git
synced 2025-01-12 14:10:34 +05:00
prepare SIMD for arm64
This commit is contained in:
parent
0c002e9efa
commit
f53c069308
@ -73,7 +73,7 @@ install(FILES ngcore.hpp archive.hpp type_traits.hpp version.hpp ngcore_api.hpp
|
|||||||
exception.hpp symboltable.hpp paje_trace.hpp utils.hpp profiler.hpp mpi_wrapper.hpp
|
exception.hpp symboltable.hpp paje_trace.hpp utils.hpp profiler.hpp mpi_wrapper.hpp
|
||||||
array.hpp taskmanager.hpp concurrentqueue.h localheap.hpp python_ngcore.hpp flags.hpp
|
array.hpp taskmanager.hpp concurrentqueue.h localheap.hpp python_ngcore.hpp flags.hpp
|
||||||
xbool.hpp signal.hpp bitarray.hpp table.hpp hashtable.hpp ranges.hpp
|
xbool.hpp signal.hpp bitarray.hpp table.hpp hashtable.hpp ranges.hpp
|
||||||
simd.hpp simd_avx.hpp simd_avx512.hpp simd_generic.hpp simd_sse.hpp
|
simd.hpp simd_avx.hpp simd_avx512.hpp simd_generic.hpp simd_sse.hpp simd_arm64.hpp
|
||||||
DESTINATION ${NG_INSTALL_DIR_INCLUDE}/core COMPONENT netgen_devel)
|
DESTINATION ${NG_INSTALL_DIR_INCLUDE}/core COMPONENT netgen_devel)
|
||||||
|
|
||||||
if(ENABLE_CPP_CORE_GUIDELINES_CHECK)
|
if(ENABLE_CPP_CORE_GUIDELINES_CHECK)
|
||||||
|
@ -26,6 +26,10 @@
|
|||||||
#include "simd_avx512.hpp"
|
#include "simd_avx512.hpp"
|
||||||
#endif
|
#endif
|
||||||
|
|
||||||
|
#ifdef __arm64__
|
||||||
|
#include "simd_arm64.hpp"
|
||||||
|
#endif
|
||||||
|
|
||||||
namespace ngcore
|
namespace ngcore
|
||||||
{
|
{
|
||||||
#ifdef NETGEN_ARCH_AMD64
|
#ifdef NETGEN_ARCH_AMD64
|
||||||
|
146
libsrc/core/simd_arm64.hpp
Normal file
146
libsrc/core/simd_arm64.hpp
Normal file
@ -0,0 +1,146 @@
|
|||||||
|
#ifdef NOTYETWORKING
|
||||||
|
|
||||||
|
#include "arm_neon.h"
|
||||||
|
|
||||||
|
namespace ngcore
|
||||||
|
{
|
||||||
|
|
||||||
|
template <>
|
||||||
|
class SIMD<mask64,2>
|
||||||
|
{
|
||||||
|
int64x2_t mask;
|
||||||
|
public:
|
||||||
|
SIMD (int i)
|
||||||
|
{
|
||||||
|
mask[0] = i > 0;
|
||||||
|
mask[1] = i > 1;
|
||||||
|
}
|
||||||
|
|
||||||
|
SIMD (bool i0, bool i1) { mask[0] = i0; mask[1] = i1; }
|
||||||
|
SIMD (SIMD<mask64,1> i0, SIMD<mask64,1> i1) { mask[0] = i0[0]; mask[1] = i1[0]; }
|
||||||
|
|
||||||
|
//SIMD (__m128i _mask) : mask(_mask) { ; }
|
||||||
|
auto Data() const { return mask; }
|
||||||
|
static constexpr int Size() { return 2; }
|
||||||
|
// static NETGEN_INLINE SIMD<mask64, 2> GetMaskFromBits (unsigned int i);
|
||||||
|
int64_t operator[] (int i) const { return mask[i]; }
|
||||||
|
|
||||||
|
auto Lo() const { return mask[0]; }
|
||||||
|
auto Hi() const { return mask[1]; }
|
||||||
|
};
|
||||||
|
|
||||||
|
|
||||||
|
template<>
|
||||||
|
class SIMD<double,2>
|
||||||
|
{
|
||||||
|
float64x2_t data;
|
||||||
|
|
||||||
|
public:
|
||||||
|
static constexpr int Size() { return 2; }
|
||||||
|
SIMD () {}
|
||||||
|
SIMD (const SIMD &) = default;
|
||||||
|
SIMD (double v0, double v1) { data[0] = v0; data[1] = v1; }
|
||||||
|
|
||||||
|
SIMD (std::array<double, 2> arr)
|
||||||
|
: data{(arr[0], arr[1])}
|
||||||
|
{}
|
||||||
|
|
||||||
|
SIMD & operator= (const SIMD &) = default;
|
||||||
|
|
||||||
|
SIMD (double val) { data[0] = data[1] = val; }
|
||||||
|
SIMD (int val) { data[0] = data[1] = double(val); }
|
||||||
|
SIMD (size_t val) { data[0] = data[1] = double(val); }
|
||||||
|
|
||||||
|
SIMD (double const * p)
|
||||||
|
{
|
||||||
|
// data = vld1q_f64(p);
|
||||||
|
data[0] = p[0];
|
||||||
|
data[1] = p[1];
|
||||||
|
}
|
||||||
|
|
||||||
|
SIMD (double const * p, SIMD<mask64,2> mask)
|
||||||
|
{
|
||||||
|
data[0] = mask[0] ? p[0] : 0;
|
||||||
|
data[1] = mask[1] ? p[1] : 0;
|
||||||
|
}
|
||||||
|
SIMD (float64x2_t _data) { data = _data; }
|
||||||
|
|
||||||
|
template<typename T, typename std::enable_if<std::is_convertible<T, std::function<double(int)>>::value, int>::type = 0>
|
||||||
|
SIMD (const T & func)
|
||||||
|
{
|
||||||
|
data[0] = func(0);
|
||||||
|
data[1] = func(1);
|
||||||
|
}
|
||||||
|
|
||||||
|
void Store (double * p)
|
||||||
|
{
|
||||||
|
// vst1q_f64(p, data);
|
||||||
|
p[0] = data[0];
|
||||||
|
p[1] = data[1];
|
||||||
|
}
|
||||||
|
|
||||||
|
void Store (double * p, SIMD<mask64,2> mask)
|
||||||
|
{
|
||||||
|
if (mask[0]) p[0] = data[0];
|
||||||
|
if (mask[1]) p[1] = data[1];
|
||||||
|
}
|
||||||
|
|
||||||
|
NETGEN_INLINE double operator[] (int i) const { return ((double*)(&data))[i]; }
|
||||||
|
NETGEN_INLINE auto Data() const { return data; }
|
||||||
|
NETGEN_INLINE auto & Data() { return data; }
|
||||||
|
|
||||||
|
|
||||||
|
operator std::tuple<double&,double&> ()
|
||||||
|
{
|
||||||
|
auto pdata = (double*)&data;
|
||||||
|
return std::tuple<double&,double&>(pdata[0], pdata[1]);
|
||||||
|
}
|
||||||
|
|
||||||
|
double Lo() const { return data[0]; }
|
||||||
|
double Hi() const { return data[1]; }
|
||||||
|
};
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
NETGEN_INLINE double HSum (SIMD<double,2> sd)
|
||||||
|
{
|
||||||
|
return sd[0]+sd[1];
|
||||||
|
}
|
||||||
|
|
||||||
|
NETGEN_INLINE SIMD<double,2> HSum (SIMD<double,2> a, SIMD<double,2> b)
|
||||||
|
{
|
||||||
|
return SIMD<double,2> (a[0]+a[1], b[0]+b[1]);
|
||||||
|
}
|
||||||
|
|
||||||
|
// a*b+c
|
||||||
|
NETGEN_INLINE SIMD<double,2> FMA (SIMD<double,2> a, SIMD<double,2> b, SIMD<double,2> c)
|
||||||
|
{
|
||||||
|
return vmlaq_f64(c.Data(), a.Data(), b.Data());
|
||||||
|
}
|
||||||
|
NETGEN_INLINE SIMD<double,2> FMA (const double & a, SIMD<double,2> b, SIMD<double,2> c)
|
||||||
|
{
|
||||||
|
return FMA(SIMD<double,2> (a), b, c);
|
||||||
|
}
|
||||||
|
// -a*b+c
|
||||||
|
NETGEN_INLINE SIMD<double,2> FNMA (SIMD<double,2> a, SIMD<double,2> b, SIMD<double,2> c)
|
||||||
|
{
|
||||||
|
return vmlsq_f64(c.Data(), a.Data(), b.Data());
|
||||||
|
// return c-a*b;
|
||||||
|
}
|
||||||
|
NETGEN_INLINE SIMD<double,2> FNMA (const double & a, SIMD<double,2> b, SIMD<double,2> c)
|
||||||
|
{
|
||||||
|
return FNMA(SIMD<double,2> (a), b, c);
|
||||||
|
}
|
||||||
|
|
||||||
|
NETGEN_INLINE SIMD<double,2> If (SIMD<mask64,2> a, SIMD<double,2> b, SIMD<double,2> c)
|
||||||
|
{
|
||||||
|
return { a[0] ? b[0] : c[0], a[1] ? b[1] : c[1] };
|
||||||
|
}
|
||||||
|
NETGEN_INLINE SIMD<int64_t,2> If (SIMD<mask64,2> a, SIMD<int64_t,2> b, SIMD<int64_t,2> c)
|
||||||
|
{
|
||||||
|
return SIMD<int64_t,2> (a[0] ? b[0] : c[0], a[1] ? b[1] : c[1]);
|
||||||
|
}
|
||||||
|
|
||||||
|
}
|
||||||
|
|
||||||
|
#endif
|
Loading…
Reference in New Issue
Block a user